编者按:李飞飞,1976年7月生于中国成都,1992年随父母前往美国定居,1999年获得普林斯顿大学学士学位,2005年获得加州理工学院电气工程科学博士学位。现为斯坦福大学计算机系讲席教授、美国工程院院士、美国国家医学院院士、美国文理科学院院士。因对人工智能发展的卓越贡献,被誉为“人工智能之教母”。
2006 年,李飞飞领导创建了一个名为 ImageNet 的项目,在人工智能领域留下了不可磨灭的印记。该项目对数百万张数字图像进行了分类,为今天震撼我们世界的人工智能系统提供了一个开创性的训练场。2023年11月,李飞飞出版《我看到的世界》(The World I see)一书,讲述了其个人追求和人工智能交织发展的精彩历程。
李飞飞是一个不愿谈论自己的人。但她想出了一个办法,将自己作为一个 16 岁就来到美国、语言不通的移民的经历融入其中,克服重重困难,成为这项关键技术的领军人物。在担任ImageNet首席科学家期间,她还曾担任斯坦福人工智能实验室主任和谷歌云人工智能与机器学习首席科学家。李飞飞说,她所著的《我所看到的世界》一书的结构就像一个双螺旋,她的个人追求和人工智能的发展轨迹交织成一个螺旋上升的整体。李飞飞说:"我们继续通过反思我们是谁来看待我们自己。"映像的一部分就是技术本身,最难看到的世界就是我们自己。"
在她讲述 ImageNet 的创建和实施过程时,这些线索最引人注目地汇聚在一起。包括她的同事在内,有人怀疑是否有可能对数百万张图片进行标注和分类,从枕头到小提琴,每个类别都有至少 1000 个例子。这项工作不仅需要技术上的毅力,还需要成千上万人的汗水(据悉,亚马逊的 Mechanical Turk 帮忙完成了这项工作)。只有了解了她的个人历程,我们才能理解这个项目。尽管经济拮据,她的父母还是坚持让她放弃商界的高薪工作,去追求自己的科学家梦想。完成这项类似于登月计划的项目将是对他们牺牲精神的最终验证。
回报是深远的。李飞飞描述了构建 ImageNet 是如何要求她以人工神经网络算法(artificial neural network algorithm)的方式来观察世界的。当她在现实世界中遇到狗、树、家具和其他物体时,她的大脑会超越本能地对她所感知的事物进行分类,进而感知物体的哪些方面能够向软件揭示其本质。什么样的视觉线索能让数字智能识别出这些东西,并进一步确定各种子类别--猎犬与灰狗、橡木与竹子、埃姆斯椅与任务摇椅?2009年ImageNet完成研发后,李飞飞发起了一场竞赛,研究人员利用该数据集训练机器学习算法,看看计算机在识别物体方面能否达到新的高度。2012 年,多伦多大学杰弗里-辛顿实验室的 AlexNet 一举夺冠,与之前的获奖者相比实现了巨大的飞跃。也许有人会说,ImageNet 和 AlexNet 的结合掀起了深度学习(deep learning)的热潮,这股热潮至今仍让我们痴迷,也为 ChatGPT 提供了动力。
李飞飞和她的团队不知道的是,这种新的观察方式也可能造成某些人类悲剧,即允许偏见玷污我们所看到的东西。她在书中写道,当谷歌把黑人误标为大猩猩的消息传出时,她感到 "一阵自责"。其他骇人听闻的例子也接踵而至。李飞飞写道:"当互联网呈现的日常生活图景以白人、西方人和男性为主时,我们的技术就很难理解每个人,"她姗姗来迟地认识到了这一缺陷。于是,她发起了一个名为 "AI4All "的项目,将女性和有色人种引入这一领域。她说:"当我们开创 ImageNet 时,我们所知道的远没有今天这么多,"她明确表示,她使用的 "我们 "是集体意义上的 "我们",而不仅仅是指她的小团队。但是,如果我们有做得不好的地方,我们必须改正。
就在我与李博士交谈的当天,《华盛顿邮报》刊登了一篇长篇文章,介绍机器学习中的偏见仍然是一个严重的问题。如今,像 Dall-E 和 Stable Diffusion 这样的人工智能图像生成器在解释某些中性提示时仍然会产生刻板印象。当被要求描绘 "一个有生产能力的人 "时,系统通常会显示白人男性,但当要求描绘 "一个在社会服务机构工作的人 "时,系统往往会显示有色人种。ImageNet 是将人类偏见灌输给人工智能的原点,那么 ImageNet 的主要发明者是否有信心解决这个问题呢?"她说:"自信这个词太简单了。我谨慎地乐观地认为,既有技术解决方案,也有管理解决方案,还有市场要求我们做得越来越好"。这种谨慎乐观的态度也延伸到了她谈论人工智能可能导致人类灭绝的可怕预测上。"她说:"我不想给人一种一切都会好起来的错觉。"但我也不想传递一种阴郁和厄运的感觉,因为人类需要希望。
李飞飞认为,进一步推动人工智能发展的一个重要因素是资金保障,以确保下一个突破,比如像 ImageNet 这样的 "新月",来自学术界和政府,而不仅仅是只顾盈利、不愿与公众分享的商业企业。今年 6 月,当拜登(Joe Biden)总统访问旧金山时,她与一小群人工智能科学家、专家和评论家面对面交流。她敦促政府资助更多的人工智能登月计划。她对拜登说:"如果我们剥夺了公共部门的资源,就是对下一代的伤害。(请注意,她并没有像马克·安德烈森(Marc Andreessen)在其最近发表的长达 5200 字的《艾恩·兰德式咆哮》中所指控的那样,说这种剥夺类似于谋杀)。
当李飞飞提出这样的 "登月计划 "时,总统是怎么说的呢?她说:"他没有当场写支票,但他用之后的行动参与了”。她指出,拜登最近关于人工智能的全面行政命令中有一节涉及公共部门投资。李飞飞并不喜欢在公众面前炫耀自己的胜利,但她似乎得到了自己想要的结果。也许,这种投资使得人工智能领域下一个 ImageNet 的进步更有可能来自李博士这样的人,因为她没有在文凭里的墨水干涸之前就跳槽到谷歌或其他初创公司。
时间旅行
在她的书中,李飞飞描述了在斯坦福大学校园内的盖茨大楼里,沉睡的斯坦福人工智能实验室(SAIL)重新焕发生机的故事。SAIL位于俯瞰斯坦福校园的山丘上。在大楼里,研究人员可以在散落在各个办公室的 64 台终端机上工作。在斯坦福,没有麻省理工学院科技广场(Tech Square)上充斥着的太空科幻小说中枪林弹雨的场景,取而代之的是托尔金(J.R.R. Tolkien)的《中土世界》(Middle Earth trilogy)三部曲中描述的精灵、霍比特人和巫师的温情传说。SAIL的房间都以 "中土世界 "中的地点命名,SAIL 打印机也被改装成可以处理三种不同的精灵字体......
没过多久,SAIL 的研究员们就注意到,低矮的天花板和房间之间的地下空间可以成为一个舒适的睡眠空间,其中有几个人还在那里住了好几年。一位系统黑客在 20 世纪 70 年代初一直住在停在大楼外停车场的那辆功能不全的汽车里--每周他都会骑自行车到帕洛阿尔托去买食物。他的另一个餐饮选择是 "奔腾的小马"(Prancing Pony),这是 SAIL 的食品自动售货机,里面装满了健康食品和当地中餐馆的锅贴。每个黑客都在 "奔腾的小马 "上有一个账户,由电脑维护。
当美国国防部高级项目研究局(ARPA) 通过互联网将斯坦福大学和其他实验室的计算机系统连接起来时,斯坦福大学和其他实验室,无论是卡内基·梅隆大学还是斯坦福研究所这样的研究中心,都变得更加紧密。这个 "ARPA 网络 "深受 "黑客伦理"(The Hacker Ethic)的影响,其价值观之一就是认为系统应该是分散的,鼓励探索,并敦促信息的自由流动。从 ARPAnet 上任何一个 "节点 "的计算机上,你都可以像坐在远处计算机系统的终端上一样工作。人们互相发送大量的电子邮件,交换技术秘密,合作开展项目,玩冒险游戏,与未曾谋面的人结成亲密的黑客友谊,并与以前黑过的地方的朋友保持联系。