在 Ubuntu 20.04 LTS 上搭建 Hadoop 环境

本文适用于 Ubuntu 20.04,对于 Ubuntu 22.04 或者更新版本的用户,请见此处

在古时候,人们用牛来拉重物。当一头牛拉不动一根原木时,人们从来没有考虑过要想方设法培育出一种更强壮的牛……

Grace Murray Hopper,美国计算机科学家

在 Apache 基金会的项目中,除了历史悠久、广泛使用的 httpd 网页服务器以外,在业界使用最广泛的技术可能就非 Hadoop 莫属了。Hadoop 提供了针对海量数据可靠的、可拓展的分布式计算解决方案。这些年来我们总能听到一些关于“Hadoop 已死?”的论调。但是来自各个云服务提供商的产品(失效链接)表明,Hadoop 及周边生态仍然在不断良性发展,并且持续触及至更多领域之中。时至今日,Hadoop 仍然是分布式处理海量数据的最佳解决方案。

为什么要有指针和引用类型?

……显然,我们能通过名字使用对象。然而在 C++ 中,大多数对象都“有身份”;也就是说对象位于内存的某个地址中,如果我们知道对象的地址和类型,就能访问它……

翻译自 Bjarne Stroustrup 《The C++ Programming Language》(Fourth Edition),Chapter 7.

@Lollipop9z(失效链接) 同学在上次与我讨论时提出了这个很有趣的问题。由于 lollipop 之前有学习 Python 程序设计语言的背景,所以对于 C++ 等语言中为何提供这些特性感到困惑。事实上,很多学习过包含指针和/或引用概念程序设计语言的同学也仍然对于为什么会存在这些语言元素的原因缺乏思考。下述代码以 C++ 为例。

你好,世界!

我最早开设个人博客的经历要追溯到 2009 年,记得当时第九驿站提供了免费的个人空间服务。对于刚上初中的我来说,虽然网站空间位于美国,并且走的是(现在看起来)速度极其慢的线路。但当时在本地写好网页文件,然后再用 FTP 客户端将网页文件拖放到服务器上的有趣体验仍然让我难忘。

时光飞逝,如今对于已经从大学科班毕业的我来说,经历了多年的计算机科学与技术方面的学习,以及在行业中摸爬滚打的经历,总算开始有一种从“接收知识”到“向别人输出知识”的冲动。就读大学期间产生的些许零碎想法,也终于在这几年的反思总结中形成体系,能够以高质量且系统化的方式向大家分享。

2023 年夏季,于香港狮子山(薄扶林郊野公园)

一直有很多同学通过各种渠道(面基、邮件、Telegram 等)跟我进行互相交流。在和这么多同学进行高质量的交流后,我发现个人力量毕竟有限,面对面的沟通终究只能帮助到少数人。得益于互联网,我愿意把自己对于知识的思考、想法、创造以及生活的点滴通过个人独立博客的形式分享给更多人。

个人力量终究有限,就像没有系统能够 100% 正确工作一样,尤其对于技术类的文章,我的行文中肯定会出现不准确甚至错误的情况。如遇问题,希望大家通过博客最下方提供的各种联系渠道和我讨论,感激不尽。

王万霖(@DGideas),2020 年 5 月 4 日

2023 年 9 月更新

发布日期:
分类:元博客