洛杉矶大数据和人工智能论坛圆满结束

<美国加州洛杉矶报道>  当地时间2017年11月5日,美国华裔教授学者协会2017年年会在美国洛杉矶圣盖博希尔顿酒店举行。当天下午的科技论坛座无虚席,尤其是大数据和人工智能讲座。 大数据和人工智能讲座由三位本协会的博士主讲,章华博士主持。讲座就当前最热门的科技话题-“大数据和人工智能“展开了讨论。 来自IBM公司的首席数据科学家刘永川博士首先就“大数据和人工智能”在科研领域的应用进行了全面的分析。刘博士对IBM公司数据分析过程和整合平台的方案加以阐述。刘博士指出大数据分析少不了智能协助。在人工智能(AI)时代来临的大背景下,不少人担心未来会有非常多的职业消失,势必会导致一定的社会失业率。对此,刘永川博士认为:“有一些职业确实会消失,更多的行业并不会消失,如果希望维持自己的工作能力,那么就必须要了解和学习大数据以及人工智能领域的知识,加以应用。 关于大数据以及人工智能应用,加州州立大学客座教授章华博士为现场的听众详细讲解了自己研究课题——大数据及人工智能在预测美国大学生辍学率的应用。章博士指出:“2008年入学的美国大学生中有30%以上在六年内辍学; 兼职学生辍学率(68.5%)高于全日制学生(19.6%);营利性学校的辍学率(49.9%)高于公立(22.7%)或非营利(17.2%)学校。”  章博士进一步指出,“美国是发达国家中大学生辍学率最高的国家。预测和干预美国大学辍学率无论对于大学本身,还是对于美国地方及联邦政府来说,都是一件非常重要并具有现实意义的事情。”“大数据和人工智能可以帮助我们解决这一棘手问题。”章博士举了华盛顿大学(Washington University)的例子,讲述了华大通过大数据分析提前对于入学学生可能发生的辍学状况进行预测和干预,成功降低了学校本科生的辍学率。 加州州立大学客座教授曹细武博士做了“人工智能:卷积神经网络在计算机视觉中的应用”的报告,形象地介绍了人工智能领域目前最热门的理论和模型:“卷积神经网络“,受到学生和专业人士的好评和关注。 从左至右,章华博士,曹细武博士,刘永川博士。 刘永川博士在演讲报告中

互联网经济第五支柱正在迅速成型

这风云突变的两年,对于国内直播行业来说,有着太多的惊喜和意外。2016年,舆论将其称之为“直播元年”;而进入2017年,整个市场又迎来了监管和洗牌,被称为大浪淘沙的一年。   在洗牌之后,这个行业开始真正显出身价?   提出这个问题,源自业界对于国内互联网经济发展现状和趋势的探讨。无论是从行业实例还是相关数据看,这个话题都已经越来越引发更多人的兴趣。我们不妨先把艾瑞咨询前不久发布的《2017年中国网络经济年度报告》作为一个引子,看看网络经济今年在移动互联网+大数据时代所发生的巨大变化。 从报告显示出的结果来看,可以简单归纳为“一大”、“一超越”、“三领先”。 “一大”指的是中国网络经济营收规模大:2016年度达到14707亿元,而且同比还增长了28.5%;“一超越”指的是移动网络经济营收规模为7907.4亿元,并且全面超过了PC端;“三领先”,则分别是指电商、广告和游戏这三大主要支柱。 如果将14707亿元总量看作是一张大饼,那么电商在其中的占比最高,营收规模为8946.2亿元,占比超过60%;而网络广告营收规模次之,占比接近20%;之后是网络游戏,占比为12.2%。三项领先的指标,加在一起大约占据了这张大饼的93%。 在这张大饼中,其余的部分主要是互联网金融领域(第三方支付)等,约为7%。不过,目前的舆论话题,正是聚焦在这其余的7%(约1030亿元左右)上面。 报告显示,移动网络用户和视频类业务的增速呈现出明显提升。伴随这一趋势,在2016年发展壮大,并且在2017年逐渐进入成熟期的直播领域,正在成为新的变量。 再来看一组数字:据中国互联网信息中心5月份发布的数据显示,国内直播用户已经达到3.25亿人;而根据机构统计的数据,2016年直播市场规模达208.3亿元,同比增长180.1%,其中来自于用户付费的营收规模占比超90%;还有机构估算,2017年直播行业市场规模或将达到340亿元。目前业内普遍的预测是,直播市场到2020年总产值将超过一千亿元人民币规模。 可以说,在电商、广告、游戏和互金之后,直播模式的爆发正在成为一种新的势能。 2017年直播进入了理性增长期,这种理性的增长,反而会让真金白银开始沉淀,并在夯实基础后迎来新一轮的爆发。   爆发的核心,会呈现在直播行业未来变现增长的趋势上。 变现形式的单一,是许多创业者心头之痛。即使是对于美图、ofo等有着天文数字般用户量的公司而言,也是如此。 而用广告变现,需要的不仅是用户数量,更需要占有用户时间,在微信和腾讯已然霸占几乎1/4用户总时长的市场里,广告变现的马太效应使得创业者的天花板变得更低。 另外,阿里线上线下新零售战略和京东的商业基础设施战略,让“城墙”高建,零售公司的独角兽之路已经接近封死。游戏公司爆款难寻,爆款以外又躲不开腾讯在上下游构建的“超级帝国”,剩下的变现模式只剩下了目前正被严厉监管的互联网金融。   直播市场的前景会是怎样?   之前,宣亚收购第一直播平台映客,被称为直播行业的分水岭。当时业界对此有很多的分析和判断,多数是怀疑映客的变现和赢利能力。 9月4日,宣亚发公告,拟以28.95亿元的价格收购映客48.25%的股权。随着收购公告的发布,映客的财务数据也首次对外披露,着实让人一惊。 报告书显示,映客业绩近两年增长迅速,2016年实现营业收入43.38亿元,净利润达到4.8亿元;2017年一季度实现营业收入10.35亿元,净利润2.44亿元。 映客目前在商业上最大的成功,不是一家企业的成功,而是给所有人杀出了一条血路——映客的惊人变现能力告诉业界,除了卖货,卖广告,卖游戏卖会员,中国互联网变现还有一条全新的道路:用户主动付费的体验经济。 回看过去这一年多的时间:360借道花椒,微博押注一直播,腾讯买遍了游戏直播平台,但此前第三方数据显示,独立发展的映客,依然占据着很大的市场红利。 分享一个有趣的现象:今年以来互联网行业拥有直播业务的上市公司,都出现了大幅业绩增长,甚至是拉升了整体业绩的爆发。这其中,包含陌陌、YY以及微博。 去年下半年涉足直播业务之后,陌陌可谓重获新生,交出了一份令华尔街惊喜的财报,让这家公司重回风口浪尖。从其财报数据来看,去年四个季度,直播营收在陌陌整体营收占比分别为30.65%、58.48%、69.17%、79.15%,直播,已经成为其绝对收入来源。 曾经以游戏语音助手著称的YY,凭借着PC时代的秀场直播,依然在直播上赚得盆满钵满。去年第4季度,YY直播收入为22.182亿元,而当季净营收24.84亿元。   直播,将会成为互联网经济的重要支柱。 在8月初一份调研数据显示,映客、花椒、一直播、美拍和来疯这五家主要直播平台,在2017年上半年合计流水高达42.373亿。报告分析,按照正常增长趋势,五家公司全年流水超百亿不是问题。 今年上半年,直播行业呈现社交化、综艺化等多元化趋势。不过,无论是直播如何在形式上、维度上、模式上变化,未来的竞争核心都是内容。很多人都意识到,社交和内容不是对立的,社交是直播发展的生命力,而内容则是精耕细作与多元化拓展趋势后,保障平台发展的核心竞争力。 一个稳健发展的市场,只有通过用户、数据和生态的完美融合,才能在电商、广告、游戏和互联网金融之外,创造出互联网经济发展的第五个支柱。   直播市场正在质变,第五极正在迅速成型。 在直播逐渐成为互联网一大支柱的新格局下,直播+到底该怎么玩? 对于未来直播市场多元化的发展方向,映客创始人奉佑生曾经提出过这样的观点:第一个方向是社交立体化,更具社交功能的产品会持续获得关注;第二个是内容多元化;第三个是垂直细分化。 而近日,奉佑生面对媒体再次针对直播的发展提出了新观点。 首先,他对未来直播平台的社交化趋势做出了时间判断,“尚处于萌芽阶段的视频社交,在未来一两年内会越发占据主流,进入大规模的普及状态。” 奉佑生同时指出,“颠覆一定是通过视频可见,是从00后的人群开始切入,这里才是颠覆大规模社交的点。” 谈到理想化的视频+社交化形态,奉佑生强调,“真正平等性的社交关系需要100%的参与,映客还谈不上真正的社交关系网,真正平等的是每个人参与表演。” 通过这些观点来看,未来这些趋势让业界兴奋的地方还在于,直播行业的发展,或许为互联网经济带来的变化不仅仅是量变。 的确,互联网经济的核心就是用户、数据和生态。我们可以将直播行业在用户、数据和生态上新的融合形式,称为互联网经济的2.0时代。 直播行业未来将会引领着无数用户向平台化转变:1.0时代“商品”是由平台(或者平台背后的生产企业)提供的,因而我们看到了电商、广告、游戏等等元素;而在2.0时代,越来越多的商品是由用户自己创造的。未来的直播平台将为每一个“平凡”的人提供更多公平的机会,让所有人都成为内容创造者和使用者。 从这个角度来看,现在直播行业的进化,仍会有更多的令人激动的可能。质变,即将发生。

10年之后我们还能做什么?

根据耶鲁大学和牛津大学的研究人员对 352 位人工智能专家进行了采访,人工智能到2060 年前后有 50%的概率完全超过人类。这份研究预测在 10 年内,人工智能将会在以 下领域超过人类:翻译领域(2024),高中水平的写作(2026),驾驶卡车(2027)。 在这份报告里,我们着重分析四种人工智能技术(语音,图像,自然语言处理,机器人) 对五个行业(安防,互联网电商/广告,消费电子,汽车,医疗)的影响(图表 2)。 从技术角度来看: 语音技术成熟但应用场景有限。语音识别是目前发展最成熟的人工智能技术。Nuance, 科大讯飞,Google,百度等主流厂商的近场语音识别率都达到 99%以上。但目前应用场 景局限在电子病例,智能客服,在线教育,车载导航等少数几个领域。随着未来语音识 别种类的进一步丰富,识别环境通用性的增强,以及远厂语音技术的突破,一定会帮助拓展其应用范围到智能家居等更多场景中。 图像识别落地机会最多。图像识别技术不但有着非常高的识别准确率,而且能够很快给 出智能的反馈,因此图像识别技术最容易快速落地到各行各业中。安防行业中的车辆数 据提取,医疗行业的影像诊断,电商行业中的精准营销,以及辅助驾驶都为图像识别技 术提供许多落地变现的机会。 自然语言处理在互联网行业中应用最为成熟。我们注意到基于人工智能的精准营销正帮助互联网广告公司不断提升流量价值,而且一些智能的销售客服机器人正在逐步替代人 工成为线上销售,售后维护的主力军。 智能机器人技术有待成熟。我们注意到一些公司开始在仓储机器人、手术机器人等细分 行业进行探索。但技术还有待成熟。 从行业角度来看: 安防是人工智能在中国最容易变现的行业:十几年的平安城市建设,使中国的城市管理 者已经积累了强大的视频数据采集能力。交通拥堵及反恐等应用场景又急需最先进的人 工智能技术。 互联网广告和电商蕴含大量的数据,为人工智能在互联网广告和电商领域的应用提供了广阔的资源和空间。例如,互联网公司通过基于用户画像的精准广告投放,在过去三年 提高了广告单次点击成本(CPC)170%。 AI 促进消费电子升级换代:3D 光学感测等 AI 功能会帮助现有智能手机提高售价,同时 促进智能音箱等新品类的发展。 汽车行业 2021 年前后实现无人驾驶:随着 Tesla AutoPilot 2 系统的发布,GM 宣布自己 的自动驾驶系统 Super Cruise。我们注意到汽车智能发展呈现加速趋势。我们预计汽车主机大厂在 2021 年前后能够实现商业化的无人驾驶服务。 医疗行业空间巨大,但技术还有待成熟。电子病历的建立,不仅仅用到了语音识别技术,也整合了医疗大数据;影像诊断则用到了图像识别技术,现在在国内外都已经形成成熟 的商业模式。辅助治疗和手术机器人由于技术的尚不完善,还在小范围推广。由于语音 识别技术和机器视觉技术的成熟,大量应用这两个技术的行业将迎来 AI 变现的更多机会。

第一位因AI丢工作的CEO

福特汽车公司忽然换帅,马克·菲尔兹(Mark Fields)被替换掉,这算是5月底的一个大新闻,尤其这件事还与无人车、汽车工业的未来等热点话题紧密相关。 小比尔·福特(William Bill Ford Jr.)领导下的董事会相中的新帅叫吉姆·哈科特(Jim Hackett)。哈科特最为人所知的经历,是将一个密西根州的小办公家具厂Steelcase,变成了在美国最有声望的企业之一。 ▲ 马克·菲尔兹 被换掉的菲尔兹风度翩翩,是销售和市场领域的名人,然而他的遭遇(或者说业绩)与哈科特恰恰相反。尽管福特挺过了2008年的金融危机,并在其后几年的经济恢复和廉价汽油双重利好的帮助下,创下了销售和利润的双重记录;近年来面临的却是利润下滑,股价下跌,以及来自董事会和投资人对于其无人车研发滞后的隐忧。菲尔兹未能成功说服小福特以及董事会,他们并没有被未来抛下。 这一次,对小福特想法的形成起到极大作用的,很可能是硅谷。 有这么两件事。 一是临近他在eBay董事会的任期将满时,意识到自己所担任的这个角色给福特公司带来了多大的优势,使他得以看到、体会到那个领域的文化,与他在底特律所熟知的企业文化之间,是多么戏剧性地不一样。目睹硅谷的公司如何占领了未来,让他明白,老牌汽车制造商们必须经历怎样的脱胎换骨才能活下去。此外,这期间所感受到的整个硅谷那种“朋友加敌人”(frenemy)的气氛,对于他来说更是完全陌生的。在汽车行业,黑白分明,竞争对手就是竞争对手;而在硅谷,全是灰色,每个竞争对手都可能在对方的公司里有投资,或者有很多单项的合作。 第二件事也因此而起。eBay的10年董事经历给小福特带来了极大的思想冲击,他决定要带领自己公司的董事会去硅谷走访一趟。就是在这一次走访中,他意外地发现,董事会成员之一吉姆·哈科特跟湾区的领袖个个都熟。62岁的哈科特先生在执掌办公家具公司Steelcase时,便因改革办公空间的设计,以适应硅工、码农军团的工作方式,而在湾区享有盛誉,但当时的哈科特肯定没有想到,这竟然给他以后的职业生涯带来了重大机遇。小福特看重的,除了他在硅谷的人员关系外,更重要的,他需要这样一个人,将硅谷文化注入福特公司。   ▲ 扎克伯格试乘混合能源自驾车 这两件事中,第一件告诉他,行业内将有天翻地覆的变化在前方等着他们;而第二件则是个提示,解决方案可能就在身边。 那一次旅行之后不出几个星期,小福特即任命哈科特为福特智能汽车部门,一个专注未来革新的新部门的头。那一步也许是铺垫,也许是测试,一年以后,哈科特接替菲尔兹成为福特汽车公司的新CEO。 如果小福特在公开演讲中提到的这两件事真的左右了他对CEO人选的决定,那么硅谷在这件事上所起的作用,在我看来,起码是成功制造了汽车巨头家族第四代掌门人对未来的恐慌。 在这次换帅之前,福特已经对“未来”有了好几项大手笔的投资。其中最引人侧目的是2月份宣布以10亿美元收购匹茨堡一家致力于自驾车人工智能及自驾车视觉研究的公司“Argo AI”;此外,去年夏天投资加州的一家开发高清3D地图的公司Civil Maps,和另一家开发激光雷达Lidar的公司Velodyne;与此同时,收购了旧金山的专车服务Chariot,以色列计算机视觉及机器学习公司SAIPS。 而福特内部,由哈科特执掌的新部门,也从2016年3月的12名员工,猛增到今天的将近600人。哈科特从执掌这个部门到执掌整个公司,基本上代表了小福特所说的:“我们将不再把新兴和核心对立起来,‘新兴’就是我们整个的公司。” 在新任上,哈科特除了要尽快提振福特三年来下跌了32%的股价,更重要的是,要确保能让福特迅速行动起来,为未来做好准备。 但是这未来是个什么样子? 目前可以看到的是,自驾车已经到来。硅谷巨头优步等都先后在美国的一些城市对这一未来愿景进行了测试;与此同时,传统的汽车制造商,比如福特、通用也都纷纷开始砸钱转向。 要对这个让小福特彻底不淡定了的“未来”有个认识,得先来看看各公司之间无人车竞赛之究竟。 无人车有别于传统汽车,主要由这几个组成部分决定: ·激光雷达Lidar系统:它不停地转动,利用激光束来生成汽车所处环境的360度图像。 ·相机:利用多幅图片产生的视差来确定与周围不同物体的距离,它也负责交通指示灯和道路指示标志信息的收集,并识别移动物体例如行人。 ·雷达传感器:测量汽车与障碍物之间的距离。 ·电脑主机(目前多数安装在汽车后备箱):分析来自各传感器的数据,将其与存储的地图进行比较、匹配,从而根据目前的情形作出操作决定。 传感器首先从周围物体中采集信息,包括这些物体的尺寸、移动的速度等,继而将这些物体按其行为归类——自行车、行人、其他汽车、静止物体。 但自驾系统并非整体上从天而降,它的许多特性,各厂家在近年来的新款车型中早已纷纷推出,有一些甚至对大部分司机来说已经非常熟悉,例如雷达、激光探测可能的碰撞,并按不同紧急程度给出不同形式的警告,盲点探测、自动泊车、巡航定速等。这一系列得到了市场认可的成熟技术,协力促进了自驾车的发展。 福特的传统竞争对手们,在这件事上基本没一个闲着的。通用向旧金山的一个手机应用公司Lyft投入5亿美元,并以10亿美元的价格买下了Cruise Automation,另外还计划在旧金山设立开发中心。菲亚特克莱斯勒也已经将某技术巨头的自驾技术应用于克莱斯勒商务车,目前该技术公司已在密西根设立了办公室,与菲亚特克莱斯勒协同工作。本田的技术听上去有些玄乎,它正在设计一种叫做“情感引擎”的东西,据说通过学习驾驶员的判断来给出下一步的操作选择和建议。沃尔沃则在瑞典的哥德堡开启了自驾SUV的试点,这一计划将逐步延伸到伦敦以及中国的一些城市。特斯拉就不用说了,不断在更新那个曾经引发严重事故的自驾软件系统。 真正让小比尔·福特心惊的当然不止这些传统对手,正在进入这个领域的高科技公司们才是他真正的威胁。Waymo的成熟度距离商业化已经不远。苹果的情况不甚清晰,它曾经有个代号Titan的项目,在2016年似乎有些缩水,前不久却忽然获准在加州进行车辆测试。优步最近被Waymo缠上了官司,控其使用盗窃来的知识产权,但这丝毫没有影响它仍然继续在匹茨堡和亚利桑那的坦佩推出自驾车雏型。 至此,汽车业的中坚,福特、通用或者大众将不再是为汽车业订立标准,引领风潮的唯一力量,它们如果能够有幸不被淘汰的话,也将不得不与新闯入的高科技世界分享这一荣耀。菲尔兹先生,这位在福特工作了28年的老兵,已经成为这一轮变幻中的首位耀眼受害者。 另外,摆在所有无人驾驶技术倡导者和开发者眼前无法回避的一个阴影,是去年5月丧生于特斯拉S型轿车自驾模式下的40岁男子乔舒亚·布朗。尽管业界给出了各种解释,如果这样……或者如果这样……这个惨剧是可以避免的;尽管特斯拉老板埃隆·马斯克也宣称系统已经更新,类似事故将永不会再发生……可这一系列的尽管,在人命面前怎么都还是显得无力。 ▲ 特斯拉S型轿车 2017年6月2日,FT登出一篇报道,Waymo开始了无人驾驶卡车的测试,此举让人不可避免地联想到去年优步在科罗拉多的一次无人驾驶实验。当时卡车司机坐在驾驶舱后排,这辆车安全行驶120英里完成了啤酒快递任务。“司机”一词在这个环境中,让人读到了一丝隐隐的不妥。 按照美国国家公共广播电台(NPR)网站上公布的一张各州职业分布变迁动图,卡车司机在很多州占据了绝对多数,因为这个职业一度对于影响美国就业市场的两大因素最具免疫力。首先,它对全球化免疫,因为别的国家的工人没法在俄亥俄开卡车;其次,它对自动化免疫,则是因为车不能自驾。眼下这第二个免疫力似乎有消失的可能,那么如此大数量的卡车司机,都将变成刚刚丢了CEO工作的菲尔兹先生吗? ▲ 1978年各州最常见工种分布图:紫色为秘书,草绿色为农民,湖绿色为卡车司机,鹅黄色为休闲业服务人员 ▲ 1994年各州最常见工种分布图:湖绿色为卡车司机,紫色为秘书,鹅黄色为休闲业服务人员以及厨师,草绿色为农民 ▲ 2002年各州最常见工种分布图:湖绿色为卡车司机,蓝色为计算机分析师,鹅黄色为休闲业服务人员,草绿色为农民,亮黄色为护士   ▲ 2014年各州最常见工种分布图:湖绿色为卡车司机,蓝色为软件开发人员,鹅黄色为零售店员或服务行业,草绿色为农民,亮黄色为护士,芥末色为小学教师 题图为小比尔·福特(右)与新任命的CEO吉姆·哈科特(左) 【作者简介】 黑爪 | 腾讯·大家专栏作者,理工背景的文学、艺术爱好者。 【精华推荐】 得给AI这熊孩子立个规矩 DeepMind研制阿尔法狗的使命,当然不是要下赢围棋  ·END·  

为什么柯洁一局都赢不了

5 月 23 至 27 日,曾战胜围棋世界冠军李世石的谷歌人工智能 AlphaGo,在浙江乌镇挑战目前世界排名第一的人类棋手柯洁九段。 柯洁首战告负,输四分之一子。人类棋手之间,这种结果说明双方棋艺基本旗鼓相当。所以有人据此认为,柯洁只是惜败。 事实上,柯洁远非惜败,而是 AlphaGo 完全掌控了棋局,在确保胜利的同时,不冒无谓的风险。 在这场人机大战开赛前,前谷歌大中华区总裁李开复就公开表示:柯洁必败毫无悬念。 不仅科技界人士这么认为,概率也显示柯洁几无胜算。根据国际职业围棋 Elo 等级分制度排名,可算出 AlphaGo 每盘的获胜概率为 99.37% 。说这是一场起重机与举重选手的比赛并不为过。 2016 年底,AlphaGo 化名“Master”横扫围棋网战平台时,即已强大到让柯洁感叹“人类几千年来总结的棋谱都是错的”。 AlphaGo 为什么这么厉害?它到底是怎么下棋的?人类顶尖围棋高手在人工智能面前的集体溃败,意味着什么? 寡不敌众的世界冠军 早在 20 世纪 50 年代,计算机科学家就开始研究让人工智能与人类下棋了。棋盘游戏是人类智力的博弈,如果能达到顶尖棋手的水平、甚至超过他们,便可证明人工智能变得更聪明、更有灵活性。 人类下棋,是经验、理性与灵感的结合。   昭和棋圣吴清源就将决定围棋胜负的三个要素归纳为:实力、气力和运气。 以此标准,人工智能“先天不足”,只有理性,靠什么与人对弈? 一言以蔽之:搜索。 早在 1952 年,人工智能就通过穷举所有可能性的”暴力搜索“,在井字棋这样的小型棋类游戏中战无不胜。   ▍在谷歌搜索框中输入“tic-tac-toe”,就能跟电脑下井字棋 / 图片来源:theverge.com 下面这幅树状图,展示了井字棋游戏中可能出现的部分棋盘情况。   人工智能要做的,就是沿着这棵“游戏树”一步步往下搜索,在所有可能出现的棋盘局面中,根据最有利于己方的终局结果,向前回溯至当前节点,决定下一步应该怎么走。 但对棋盘更大、可能性更多的游戏,暴力搜索就行不通了,因为棋局的可能性远超人工智能的运算能力,纯靠搜索不可能下赢顶尖棋手。 国际象棋和围棋一度被认为是“人类智慧的最后堡垒”,原因就在于此。   ▍国际象棋的棋盘为 8×8 的网格,在对阵双方各走三步以后,可能出现的棋局就超过九百万种 要在这类游戏中战胜人类,人工智能必须在暴力搜索的基础上优化改进。 取得突破的是 1997 年

Facebook全新CNN机器翻译:准确度超越谷歌而且还快九倍

去年谷歌在机器翻译上取得了连续不断的突破,参阅《重磅 | 谷歌翻译整合神经网络:机器翻译实现颠覆性突破》和《重磅 | 谷歌神经机器翻译再突破:实现高质量多语言翻译和 zero-shot 翻译》。谷歌的方法用到了文本处理惯用的循环神经网络。近日,Facebook 也宣布在神经机器翻译上取得了重大进展,在超过了去年谷歌研究的水平的同时还实现了显著的速度提升。而和谷歌的方法不一样,Facebook 的方法采用了一种完全基于卷积神经网络的架构。机器之心对 Facebook 博客上的介绍文章进行编译,同时在文末附上了该研究论文的摘要介绍,另外该研究的相关源代码和模型也已经在 GitHub 上开源。 Facebook 的使命是让世界更加开放和互联,让每个人都能以自己偏好的语言享受视频和博文——当然,准确度和速度要尽可能最高。因此,语言翻译就显得很重要了。 今天,FAIR 团队推出了一项研究成果:使用一种全新的卷积神经网络(CNN)进行语言翻译,结果以 9 倍于以往循环神经网络(CNN)的速度实现了目前最高准确率。[1] 另外,你可以在 GitHub 开源许可下下载到 FAIR 序列模型工具包(fairseq)源代码和训练过的系统,研究人员可以打造用于翻译、文本摘要以及针对其他任务的定制化模型。 为什么是 CNN? 几十年前,最初由 Yann LeCun 开发的 CNN 已经成功用于多个机器学习领域,比如图像处理。不过,对于文本应用来说,因为 RNN 的高准确度,其已经当仁不让地成为了被最广泛采用的技术和语言翻译的最佳选择。 尽管历史表明,在语言翻译任务上,RNN 胜过 CNN,但其内在设计是有局限性,只要看看它是如何处理信息的就能明白这一点。计算机的翻译办法是:阅读某种语言句子,然后预测在另一种语言中相同含义的语词排列顺序。RNN 运行严格遵照从左到右或者从右到左的顺序,一次处理一个单词。这一运行方式并不天然地契合驱动现代机器学习系统的高度并行的 GPU 硬件。由于每个单词必须等到网络处理完前一个单词,因此计算并不是完全并行的。对比之下,CNN 能够同时计算所有元素,充分利用了 GPU 的并行,计算也因此更高效。CNN 的另一个优势就是以分层的方式处理信息,因此,捕捉数据中的复杂关系也更容易些。 在之前的研究中,被用于翻译任务的 CNN 的表现并不比 RNN 出色。然而,鉴于 CNN 架构潜力,FAIR 开始研究将 CNN 用于翻译,结果发现了一种翻译模型设计,该设计能够让 CNN

我们离埃隆·马斯克的脑机接口有多远

文章来源:神经现实 原文作者:James Wu, Rajesh P.N. Rao 将我们的大脑与技术直接相连可能最终会是一个自然进程,人类自古以来一直通过技术来增强自身能力。 正如古希腊人梦想着可以冲上云霄一样,当今人类的希冀则是意识与机器的融合,以弥补肉体会死亡的缺憾。 通过脑机接口(BCI)技术将人类意识与人工智能、机器人或者其他人的意识相连,是否可以超越人类本身的局限性呢? 在过去的50年间,来自全球各大学实验室以及公司中的研究者们致力于实现这一愿景,并且已经取得了令人瞩目的进展。 最近,诸如Neuralink的创始人埃隆·马斯克(Elon Musk),Kernel联合创始人布莱恩·约翰逊(Bryan Johnson)等成功的企业家们成立了新的创业公司,声称将会通过脑机接口技术增强人类的能力。 将技术与大脑成功相连究竟离我们多远?当我们的意识接入机器的时候究竟会产生什么影响? 感觉运动神经工程中心(CSNE)的研究人员埃布·菲兹(Eb Fetz)是最早进行脑机相连的开拓者之一。在个人电脑甚至还没被发明出来的1969年,菲兹展示了猴子可以通过增强它们的脑信号来移动表盘上的指针。 最近的脑机接口研究旨在提高瘫痪或者有严重运动障碍患者的生活质量。你可能已经在新闻中看到了最新进展:美国匹兹堡大学的学者用从大脑内部获取的信号来控制机械臂。斯坦福大学研究者可以从瘫痪者大脑信号中提取他们的运动意图,从而让他们能使用无线平板电脑。 同样的,通过向脑内或者脑表面传递脑电波,一些受限的虚拟感觉也可以被传回到大脑。 那我们主要的感觉(视觉与听觉)也可以进行传递吗?针对有严重视力障碍的人,早期的仿生眼已进行商业化的量产,加强版正在进行人体试验。另一方面,人造耳蜗已经成为最成功也是最普遍的仿生植入物之一,全球有超过30万的用户通过它来获得听觉。 最复杂的脑机接口是“双向”脑机接口,它既能记录又能刺激神经系统的活动。在我们中心,我们正在探索将双向脑机接口作为一种新型的医疗工具,以应对中风和脊髓损伤。我们的研究显示,双向脑机接口可以用于增强两个脑区之间或者脑与脊髓之间的连接,变更伤患处的信息以重现唤醒瘫痪的肢体。 随着这些成功的到来,你可能以为脑机接口会是下一个消费者必需的小工具。但是对现有的一些脑机接口的表现仔细审视以后,我们可以发现距离这一天的到来还有很长的路要走:相比较那些肢体健全的人每天用四肢很容易就做出的简单动作,脑机接口产生的运动要慢的多,并且不够协调和准确。仿生眼产生的视觉具有非常低的分辨率;人造耳蜗所带来电子化的言语信息是有限的,并且会使人对音乐的感知失真。 为了让这些科学技术发挥作用,必需通过手术将电极植入体内——这前景当今大多数人都不会考虑。 但并不是所有的脑机接口都是侵入式的。不需要手术介入的非侵入式脑机接口的确存在;它们基于头皮表层记录的脑电波运作,已被证明可以用于控制光标,轮椅,机器人手臂,无人机,人形机器人,甚至可以用于脑与脑之间的交流。 2006年,华盛顿大学的神经系统实验室展示了现实世界中的“阿凡达”:名为Morpheus的首个非侵入式的脑控人形机器人。当表示想要的东西或者位置的图像闪烁的时候,这个非侵入式的脑机接口会基于大脑的反馈信号对机器人做出应该拿什么或者拿去哪里的指示。 但所有的演示均在实验室中进行——实验室环境安静,被试没有分心,技术设置漫长且有条理,显示出概念的可行以后实验才会结束。使这些系统足够快速以及强大到在现实世界中得到实际应用,已被证实非常困难。 即使使用侵入式电极来读取心灵,也会产生另一个问题,即我们的大脑究竟是怎样被建构的。我们都知道每个神经元和与其相近的数千个神经元组成了一个难以想象的巨大且不断变化的网络。这对于神经工程师们来说意味着什么呢? 想象一下,你正在试图了解一大群朋友基于一个复杂主题的对话,但是你只被允许听其中一个人的想法。你可能会弄明白这个交流的粗略主题,但你绝不可能弄清楚整个讨论的所有细枝末节。 因为即使是最好的侵入式电极,也只能让我们一次性聆听大脑的几个小脑区,我们可以做一些令人印象深刻的事情(指的是前面的那些实验),但是还远远不能理解全部的对话。 还有就是我们所认为的一种语言障碍。神经元通过电信号和化学反馈的复杂交互与其余的神经元进行联系。这种本来的电-化学语言可以通过电路进行解析,但是并没有那么简单。同样地,当我们用电刺激回传信息给大脑时,会带有浓重的电子“口音”。这使得在众多其他正在进行的电活动中,神经元难以理解电刺激想传达的信息。 最终,还有损伤的问题。脑组织非常软而且脆弱,但是连接脑组织的电导材料却很坚硬。这意味着侵入式电极会造成创伤并产生免疫反应,并且随着时间的推移它会丧失功效。灵活的生物纤维和阵列可能最终在这方面会起到作用。 虽然面临着这些挑战,但我们对于仿生未来依旧保持乐观。脑机接口不一定要完美。大脑具有惊人的适应性,在学习使用脑机接口上,有点类似于学习一些像是开车或者使用触摸屏这样的新技能。同样地,即使使用电磁脉冲这种非侵入式的媒介来传播新型的感觉信息,大脑也可以尝试着解析它。 最终,我们认为, “共同适应”的双向脑机接口可能会被证实是建立神经桥梁的一个必要步骤。双向脑机接口中电子设备与大脑共同学习,并在学习过程中不断向大脑传递信息。构建这种共同适应的双向脑机接口是感觉运动神经工程中心的目标。 对于最近使用“电子疗法”靶向治疗像是糖尿病等慢性疾病所取得的最新成果,我们同样感到非常兴奋。这项疗法没有通过药物,而是利用小型实验性植入物直接向内部器官传达命令。 对大脑进行干预以治疗疾病改变了我们的本质吗? 研究人员已经发现了克服“电——生化语言”障碍的新途径。比如,注射性的“神经织网”被证实可能会是一种有希望的途径,它允许神经元逐渐在电极周围生长,而不是拒绝电极。在将来,基于纳米导线的灵活探针,柔性的神经元支架和玻碳接口可能也会允许生物性和技术性的计算机与我们的身体友好共存。 埃隆·马斯克的新创业公司Neuralink具有明确的最终目标,即通过脑机接口增强人类大脑,以使得我们能够在与人工智能的持续进行的军备竞赛中可以脱颖而出。他希望通过连接技术,能够使得人类自身的大脑能力得到增强,而这有可能会让我们避免AI已经远远超越人类能力的反乌托邦式未来。这样的想法可能看起来很遥远或者异想天开,但是我们不能因为陌生就单单忽略这个想法。毕竟无人驾驶汽车在十五年前还被归为科幻,而它们现在已经驶上公路。 在不远的未来,当脑机接口从恢复残疾人的身体机能到增强肢体健全人能力的时候,我们需要敏锐地觉知到许多与许可、隐私、身份、媒介和不平等相关的问题。在我们中心,哲学家、临床医师和工程师团队正在积极处理这些伦理性、道德性和社会正义类问题,他们致力于在该领域进程超前之前提供神经类指导。 将我们的大脑与技术直接相连可能最终会是一个自然进程,人类自古以来一直通过技术来增强自身能力——从利用轮子来突破双足限制到在粘土与纸张上记录符号来增强记忆。 增强能力的脑机接口有点像是现如今的电脑、智能手机和VR眼睛,当它们终将出现在消费市场时,将会令人振奋或沮丧,而风险与希望也将并存。

机器智能教父:AI将在2050年超越人类,几百万年后将统治银河

“很快,最明智、最重要的决策者可能不再是人类。” ——于尔根·施米德休伯 柏林演讲 在西柏林一处仓库后方的工作室里,一群来自全球各地的科学家正在热烈讨论着机器人的未来。 一位来自欧洲大型汽车厂商的工程师刚刚就自动驾驶汽车的进展发表了一份谨慎乐观的报告。 他说,自动驾驶汽车正逐渐学会把行人、骑行者与汽车区分开。有些机器人已能比人类更好地分辨不同品种的狗。 接着,一位高大健壮的男士大步走上讲台。“很快,最明智、最重要的决策者可能不再是人类。”他一边说,一边无奈地笑着,“我们即将迎来的不是另一场工业革命,而是一种新生命形式,它更像是一场创世大爆炸。” 于尔根·施米德休伯(Jürgen Schmidhuber)一直被描述为“将会被首批拥有自我意识的机器人称作父亲的人”。 这位54岁的德国科学家或许开发了能让我们与计算机进行对话,或在手机上把普通话翻译成英文的算法,但对于未来机器人存在的主要使命是为人类服务,他却不大认同。 相反,施米德休伯认为,机器智能不仅会很快达到人类的水平,而且会很快超过人类。它将建造出耐热型机器人,与柔弱的人类相比,它可以更好地利用太阳的能源。 最终,机器智能将通过自我复制的机器人工厂,在整个银河系的小行星带建立殖民地。而施米德休伯正是试图为这种机器人打造大脑的人。 “到2050年,我们将拥有比人类更聪明的人工智能”……机器人Pepper “真正的人工智能” 演讲结束后,施米德休伯接受了我的采访。他说,在瑞士的实验室里,他的公司Nnaisense已在开发能够像婴儿一样运转的系统,研究人员为这些系统设置了一些小实验,以便让它们更了解这个世界如何运转。 施米德休伯称之为“真正的人工智能”。唯一的问题在于,它们仍然太慢了:这些系统目前的神经连接只有大约10亿个,而人类大脑皮层的神经连接则在100万亿个左右。 “但现在有一种趋势,计算机的速度每五年就会加快十倍,除非这一趋势中断,否则只需25年,我们就能开发出媲美人类大脑的递归神经网络。用不了多少年,我们就可以开发出某些动物水平的人工智能,比如乌鸦或是卷尾猴。” 那么,究竟要多少年呢?“可能不是几十年,也许几年就够了,不过,我不想把自己的预测限定在四年或七年的范围内。” 当我问他,为何对自己的时间表如此有信心时,他打开了话匣子。我们从宇宙大爆炸聊到新石器革命,从火药发明聊到万维网。 施米德休伯表示,宇宙重大历史事件的时间间隔似乎在指数式地缩短,两次里程碑事件的时间间隔大约是前一个间隔的四分之一。如果按这个规律计算,人工智能超越人类,也许会在2050年变成现实。 “到2050年,时间不会停止,但我们将拥有比人类更聪明的人工智能。它们不想困守地球,它们想推动历史进入下一个阶段,想去寻找更多的资源。几百万年后,它们将殖民整个银河系。” 在探索太空的过程中……机器人将是领路人,施米德休伯说。 他把这个时间关口称为“欧米茄点”(Omega Point),该词语由法国牧师皮埃尔·泰亚尔·德·夏尔丹(Pierre Teilhard de Chardin)创造。施米德休伯说,他喜欢“欧米茄”这个词,因为它读起来有点像“Oh my God”(哦,我的上帝)。 “机器智能教父” 施米德休伯“机器智能教父”的地位并非毫无争议。 作为一名计算机科学家,有时他的言论听上去实在是不像科学。在柏林的演讲中,观众席后排就传出了抱怨的声音。 当施米德休伯描述机器人最终将如何抛下地球,“独自享受”探索宇宙的乐趣时,一位巴西的神经科学家打断了他的发言:“这就是你要说的?会有一种让机器人学会享乐的算法?你这是在糟蹋科学,真是太可怕了!” 当被问及这些事时,施米德休伯再次露出那种无奈的表情。“几十年来,我的论文一直备受争议。所以,我已经习惯了这些标准的论调。但很多神经科学家并不清楚人工智能领域正在发生什么。” 然而,即便在人工智能学界内部,也有反对的声音。当我向一些人工智能研究者提到他的名字时,有几个人说,他的研究工作无疑很有影响力,而且“越来越有影响力”,但他“有一点争强好胜”。 很多人觉得,他对于技术进步速度的乐观看法是毫无根据的,或许还很危险。 有人说,施米德休伯绝对算不上是机器人未来的真正预见者,实际上,他正在使人工智能沦为下一个赛格威平衡车(Segway)——赛格威诞生之初,曾被吹捧为意义堪比个人电脑的技术革命,但最终却沦为电影里的杂耍道具。 是先知,还是笑柄? 是先知,还是笑柄?要弄清这个问题,我们就得深入了解施米德休伯的人生经历。 他1963年出生于慕尼黑,青春期时,他从图书馆借阅了大量科普书籍和科幻小说——他尤其喜欢奥拉夫·斯泰普尔顿(Olaf Stapleton)的《造星人》(Star Maker)、E·T·A·霍夫曼(ETA Hoffmann)的《沙人》(The Sandman),以及史坦尼斯劳·莱姆(Stanislaw Lem)的小说——就这样,他对机器人产生了兴趣。 “我最棒的偶像”……施米德休伯很崇敬爱因斯坦。 施米德休伯说:“我最棒的偶像是阿尔伯特·爱因斯坦。我在某个时候意识到,如果我打造出了比我自己乃至比爱因斯坦更聪明的东西,我会拥有更大的影响力。” 他在慕尼黑工业大学拿到了数学和计算机科学学位,并在30岁时获聘成为该大学教授。 1997年,施米德休伯和学生赛普·霍克赖特(Sepp Hochreiter)共同撰写了一篇论文,其中提出了一种利用记忆功能来增强人工神经网络(模拟人类大脑的计算机系统)的方法,即根据之前获得的信息,添加解释文字或图像模式的循环。他们称之为“长短期记忆”(Long Short-Term Memory,简称LSTM)。 当时,人工智能正在经历漫长的“寒冬”:对于围绕人工智能的第一波炒作,技术未能达到相应的水平;而且,资金也很难到位。 20世纪60年代时,人们期望对机器进行自上向下式的编程,使其能够理解世界的复杂性。如果说现在出现了什么新声音,那就是一种看似更简单的想法:我们可以为机器编写一种算法,这种算法相对简单,但可以让它们自底向上式地学习,从而逐渐理解现实世界的复杂性。 1997年,施米德休伯关于LSTM的论文被麻省理工学院退稿。但现在看来,LSTM已成为深度学习领域一波新的研究浪潮背后的关键概念之一。

潘云鹤院士:人工智能迈向2.0

近年来,人们对人工智能(artificial intelligence,简称AI)产生浓厚兴趣,产业界首先布局。大量资本与并购的涌入加速了AI技术与应用的结合,并蔓延升温。据美国CBInsight公司2016年7月报告,2011年至今,谷歌、微软、Twitter、Intel、Apple等IT巨头收购了约140家AI领域的创业公司。仅2016年上半年,资本市场对AI投入已超2015年全年。 谷歌2014年高价收购DeepMind公司,2016年研制的AlphaGo战胜了围棋世界冠军,2017年初又60连胜,谷歌自称正从一个“移动优先”转向“AI优先”的公司。微软小冰聊天机器人,正引导从传统的“图形界面”向“自然语言和情感理解交互界面”转变;IBM开发Watson系统已进入医院,正在改变肿瘤临床诊断与治疗的运作模式;百度公司因在机器翻译、自然语言理解和智能汽车的布局,被评誉“最聪明的公司”……这些进步预示着AI技术将有大的飞跃。 1956年,美国学者首次提出“AI”概念,即:让机器能像人那样理解、思考和学习,即用计算机模拟人的智能。传统AI典型研究的领域是:机器定理证明、机器翻译、专家系统、博弈、模式识别、机器学习、机器人与智能控制等,逐步形成符号、连接、行为等学派。 AI进步的动力不仅来自于内部驱动,更来自于信息环境与社会需求等外部驱动。 随着移动终端、互联网、传感器网、车联网、穿戴设备等的流行,感知设备遍布全球,计算与人类密切相伴,网络连接着个体和群体,快速反映与聚集他们的发现、需求、创意、知识和能力。同时,世界已从二元空间结构(物理, 人类社会)演变为三元空间结构(信息网络, 物理, 人类社会),它们之间的互动将形成各种新计算,包括感知融合、“人在回路中”、增强现实(AR)、跨媒体计算等等。 智能化的需求牵引,使AI在城市、医疗、交通、物流、机器人、无人驾驶、手机、游戏、制造、社会、经济等发展中成为新技术、新目标,很多企业和城市已进行AI布局。 从过去追求“用计算机模拟AI”,转化为:用机器与人结合成增强的混合智能系统;用机器、人、网络结合成新的群智系统;用人、机器、网络和物结合成的智能城市等更复杂的智能系统。 AI基本方法是数据驱动的算法,今后将涌现出大数据、传感器、网络、跨媒体等驱动计算,从而使大数据、感知融合、跨媒体等智能发展成为必然,传统以字符为基础的机器智能测试图灵方法将受到挑战。 当前,若干新技术变化已初露端倪,成为AI迈向2.0的技术萌芽。 以DeepMind的AlphaGo技术为例,其深度强化学习发展了“直觉感知(下一步在哪)”、“棋局推理(全局获胜机会如何)”和“新颖落子(想人所不敢想)”等能力,并将记忆人类棋局和自我博弈积累棋局结合了起来。目前,该深度学习技术的缺陷是不可解释,不通用,需要大数据智能的发展来解决。 事实上,大规模个体通过互联网参与和交互,可实现超乎寻常的智慧能力。如,普林斯顿大学Connectome项目开发的EyeWire游戏,玩家可对显微图像中单个细胞及其神经元连接按功能进行涂色,145个国家的165000多名科学家及志愿者参与,首次详述了哺乳动物视网膜神经组织如何检测运动的结构功能关系等。群智计算能将极大提高人类社会的智能水平,用途广,其理论和技术尚处原始阶段。 2008年,中国科学家率先提出了“跨媒体计算”概念。2010年,《Nature》发文指出,文本、图像、语音、视频及其交互属性将紧密混合一体,即为“跨媒体”。跨媒体智能是机器认知外界环境的基础,对语言、视觉、图形和听觉的语义贯通是实现联想、设计、概括、创造等智能行为的关键。当前,其尚处发展萌芽状态,可望形成新一代AI的重要领域。 用计算机来模拟人的智能固然重要,而让计算机与人协同,取长补短而成为一种“1+1>2”的增强性智能系统则更为重要。当前,各种穿戴设备、智能驾驶、外骨骼设备、人机协同手术等纷纷出现,而宏观系统的人机协同有更大空间,预示着人机协同增强智能系统的前景广泛。 AI诞生之际,机器人被列入其目标领域,仿生学也成为重要发展方向。但大多数案例表明,对原有机械装备进行智能化和自主化升级,要比类人机器人更高效。因此,自主智能系统将成为新一代AI的重要方向,也对制造业升级尤为重要。 综上所述,我们给出的AI2.0初步定义是:基于重大变化的信息新环境和发展新目标的新一代人工智能。其中,信息新环境是指:互联网与移动终端的普及、传感网的渗透、大数据的涌现和网上社区的兴起等等。新目标是指:智能城市、智能经济、智能制造、智能医疗、智能家居、智能驾驶等从宏观到微观的智能化新需求。可望升级的新技术有:大数据智能、跨媒体智能、自主智能、人机混合增强智能和群体智能等。 AI2.0的技术特征表现在:一是从传统知识表达技术到大数据驱动知识学习,转向大数据驱动和知识指导相结合的方式,其中机器学习不但可自动,还可解释,更广泛;二是从分类型处理多媒体数据 (如视觉、听觉、文字等),迈向跨媒体认知、学习和推理的新水平;三是从追求“智能机器”到高水平的人机协同融合,走向混合型增强智能的新计算形态;四是从聚焦研究“个体智能”到基于互联网络的群体智能,形成在网上激发组织群体智能的技术与平台;五是将研究的理念从机器人转向更加广阔的智能自主系统,从而促进改造各种机械、装备和产品,走上智能化之路。 相比以往,AI2.0将不但以更接近人类智能的形态存在,而且以提高人类智力活动能力为主要目标,将紧密融入我们的生活(跨媒体和无人系统),甚至扩展为我们身体一部分(混合增强智能),可以阅读、管理、重组人类知识(大数据智能与群体智能),为生活、生产、资源、环境等社会发展问题提出建议,在越来越多的专门领域的博弈、识别、控制、预测中接近甚至超越人的能力。 中国正值工业化、城镇化、信息化、农业现代化和绿色化发展高潮,急需AI发展不断改善人民生活,提高社会生产力,优化城镇的发展、提高资源利用水平,促进教育、医疗、贫困、环境、资源等紧迫问题的解决。 建议我国布局实施AI2.0时,一是要与重大需求和已积累的发展成果相结合,如电子政务、电子商务、快递物流、智能社区、分享经济、智能手机、电视家电、制造业升级,和创新设计、跨媒体计算、图像编码、中文识别、知识中心、智能城市及大数据等先行理念或技术成果;二是研究内容要围绕大数据智能、互联网群体智能、跨媒体智能、人机混合增强智能、自主智能系统等新一代方向;三是中国要推动和全球各国科学家与智库开展合作,推动人工智能技术能沿着服务人类的正确方向升级。 (作者系中国工程院院士、中国工程院原常务副院长,此文英文版发表于中国工程院院刊《Engineering》)

不是人类被机器取代,而是“人类社会”被“社会机器”取代

导读:本文为鲍捷的最新力作,观点犀利。作者首先提出人类的大多数,终将陷入文化的真社会性的工蜂阶层,他们将留不下文化的后裔,他们将被机器取代。作者认为爱情和意识对AI只是Bug,机器根本不需要模仿人类糟糕的智能。最终作者认为人类的延续绝不仅仅是人类本身,要么脱壳,要么脱轨,飞向星辰。 ——————————————- 不要问机器为你做了什么,问问你为机器做了什么。 人是软件定义的动物 人有三万个基因。几百个基因的区别就能区分两个物种。但人的一生其实被文因(Meme)塑造,一生被imprint(思想钢印)进大脑的文因,何止三万个。两种不同文化的人,其行为的差别,超越任何物种的差别。人类是一种软件定义的生物,是软件赋予了我们进化的无穷潜力,直至毁灭自身的可能。为了可以灌入软件,我们不惜让每个婴儿都早产一年。 社会是软件定义的种群。人类在最近 5000 年锲而不舍,把定义人的软件转写为定义社会的软件,直到社会本身崛起为新的生物。 但文化进化的速度与基因进化速度的鸿沟越来越大。文化进化的速度越来越快,和基因进化的慢速矛盾越来越大。人类的基本认知能力并无大的进步,人类的大部分越来越不能跟上文化的发展。过去几十年中,通过教育年限的增长弥补了一些差距,已经达到了二十年的教育,但年限不可能无限延长。抗衡原始的认知惰性所需要的教育和资源越来越多。这种投入的增长有限,其边际效益又是递减的,而文化的进化速度是加速的。 人类科技进步的大部分投资“浪费”在了通信上。首先,由于大多数的资本掌握在对科学一窍不通的人手里,人类要花费巨额的时间和投入去让这些动物理解。其次,由于人类硬件的先天限制,需要花二十年时间才能从知识上复制一个人。 文化进化速度的提高,不仅在于机器的速度,而且在于人的理解速度。真正的语义通信的速度,瓶颈不在于机器,而在于人。最后必要诉诸认知能力的外化,也就是机器增强的人脑。人类逐渐将能耗最高的认知能力外包给机器以缓解这个矛盾。人需要用机器来扩展自己的认知能力,这样可以延缓脱轨,但也不过也最多延缓一百年。 基因是自私的,文化也是自私的。赋予人类获得进化优势的文化是自私的,它不在乎它的载体的存亡,它只服从与在竞争中复制自己。人类从书写开始,就不断在文化进化的压力下,乖乖地做文化转移载体的工具。从祭司到软件工程师,都在做文化进化的线粒体。 建立人人平等的社会是人类自古以来的理想,但也从来没有成功过。这是个非常崇高和善良的理想,可是它的执行,几乎总是会导致新的不平等。也许,人类作为一个社会性物种,构成社会的根基就是等级,按体力,财富,信息等等随时代不断变化。人人平等终究是一个幻想。在人类有了机器增强后,会不会拉近人的认知差距,让一个一般的人也赶上牛人?不会,这个差距会急剧加大。原来有10倍差距,有了机器辅助,这个差距会扩大到100倍甚至1000倍。因为理性是反人性的,理性的获得非常困难。无法自然扩展理性,只能拉大社会的理性鸿沟。 人类的大多数,终将陷入文化的真社会性的工蜂阶层。他们将留不下文化的后裔。他们将被机器取代。  乌合之众 人类基本的信息处理能力,还是在大规模(超过数百人)社会形成之前。语言,视觉,听觉,信任,对证据的直觉依赖,都是适应于草原部落生活的进化。这些已经写入基因,构成认知的快速通道和潜意识。而文字,符号,逻辑,科学方法(指系统的寻证方法),超越小部落的信任传递,这些是后生,慢速,困难的。机器在群体上只要超越了爬行动物,就可以超越人类。 人类有四套认知系统:原始的爬行动物认知系统,5万年前语言成熟时发展的,5000年前文字发明后发展的,和500年前科学兴起后发展的。每一套都比前一套更不“自然”,更耗费能量,速度更慢。所以人总是倾向于用低层次的认知系统。 并不是说90%的人只会用5万年前的认知方式思考,每个人都是多种认知方式的综合,比例不同。而人群的总体,在90%的人脑“机时”里,是那些原始的认知在起作用。能够有效利用这种特点的人,都成了伟大的政治家,教主和商业领袖。90%只是个大意,并不是说真的精确到这个数字,总体人群的大多数大多数时间倾向于“不动脑子”,这个应该很容易理解。 这里定性地定义一下“愚蠢”:是指人类的一种认知的惰性,使个体比较偏向于使用5万年前成熟的那套思维系统,而不是5000年前文字发明和500年前科学发展后发展的这两套思维系统。行为经济学,人机界面设计,传播理论里对这种“非理性”有很多研究。 人类的理性与非理性矛盾,早在文字或者文明产生前就已存在。思维的每一步跃迁,都要求更多的能量,但能量供给有限,这就要求原始猿类或人类在有限时间内利用较原始的认知作出决策。故而人类从总体上是一个非常难以协调的物种,因为我们文化的进化远远超过了基因进化的速度,我们需要极大的成本才能沟通和复制知识。没有强力的组织,人类社会很容易分崩离析。一群无组织的人类和一群蜥蜴的智力无异。 人类无法摆脱迷信。吃饭是个体存续的基础,迷信是社会存续的基础。大脑不是用来思考的,它的真正作用在于使你避免思考。我们的大脑的绝大部分,都是在让我们顺从激素、爬行动物脑,而不是去动用耗能昂贵的分析,特别是不要去动用后天才能获得的符号和理性思维。分析、符号和理性都是大脑的敌人,我们必须无时无刻不和本能做斗争才能运用它们。人类社会自己的复杂性已经是普遍不可能理解的了。如果人人都追求理性,而社会维持成本就会极高,我们需要十倍、百倍的物质和能量消耗才能维持社会。 政治,宗教,计算广告学之所以能奏效,就是基于无组织人群的普遍愚蠢。人类在可以遇见的将来不能消除这些愚蠢。人工智能超越人的智能,并不需要比人聪明,而只需要避免的人的愚蠢就够了。 作为集体的机器不会出现乌合之众现象。因为乌合之众现象是人的gene和meme进化速度失配造成的。机器社会与机器个体不存在这种失配。因此人类终将被“社会机器”取代,因为人类无法克服自己的本性。   爱情和意识对AI只是Bug 人工智能不是人类智能。 1)AI实现的不是人的智能 2)AI的设计和人脑的工作过程无关 3)AI感知的世界和人感知的世界全然不同 4)机器需要的智能和人需要的完全不同。 人工智能不是要复制人的智能,而只是要适应人的愚蠢。机器只是笨,人是愚蠢。笨可以治,蠢是世界观,无药可救。人工智能就是一些算法,和人的智能是没有关系的,也不应该有关系。人的智能是很糟糕的东西,机器根本不需要模仿这么拙劣的东西。 人类往往迷恋于喜怒哀乐,往往认为理解这些才是真正的智能。但是这些也只是人类在发展社会性的进化过程中发展起来的延伸的表现型。另一类系统不需要付出这些成本也可以构成坚强的社会,因为它们有完全不同的通信手段。 人工智能并不只是机器人。它是我们通信的界面,是我们构造的秩序。它不是要取代大脑,而是增补大脑。它要解决的不是人个体的问题,而是社会和文化的问题。写进基因的智能AI比较难模仿,最近50000年文化产生的智能比较容易。说到底,目前的AI是一种从人作为文化载体到机器作为文化载体的过渡。 人类担心机器会进化出意识,就像担心蚂蚁会喜欢林志玲。意识也只是进化过程中一种特定的适应性,并非智能的必然的高级属性。同样,爱情也只是社会性的进化出来的表现型。 对于机器,没有爱情和意识是个 feature,不是bug。他们完全不需要这些bug。 图灵测试 人总是在问机器何时通过人的图灵测试。其实结局是人何时通过机器的图灵测试。机器可能通过前者,人永远通不过后者。 图灵测试说,超过30%的人无法区分人和计算机就算过了。问题是,哪些人能代表人类?所以这是个政治问题。如果民主的话,那图灵测试现在就可以过了。 我觉得全人类有一个“人类图灵测试指数”,就是把所有人中能识别当前最先进的AI是否为人的比例。鉴于大多数人并不理性思考,想想有多少人还信各种莫名其妙的巫术,我觉得这个人类图灵测试指数应该是一个非常低的数字。 相对应的是“机器图灵测试指数”,就是最聪明的人能否识别各种AI是否为人的比例。这接近于一般意义上的图灵测试。该值应该是很高的。 人不是理性动物,人对机器智能程度的判断会深深受大脑固化的非理性支配。图灵测试考验的最终不是机器的智能,而是人的智能。 图灵测试不是问题,图灵测试的图灵测试(是不是用机器判断机器的拟人性)才是问题。人最终要从整个流程滚出去。 其实图灵测试涮掉机器之前,早就把99%的人给涮掉了。其实“图灵测试”测试的是人的智能的下限,而不是机器智能的上限。找一个白痴来测试机器,随便什么程序都能过。每次图灵测试的新闻,媒体都这么兴奋。大多数媒体没有通过图灵测试的测试。 如果大多数人区别不出哪首是机器写的,不是因为机器理解了诗,而是因为人不理解诗。图灵测试的问题是,由于人类智力分布金字塔极端不均匀,如果选择金字塔底层人不熟悉的问题,那机器通过。例如薇薇作诗机还是很厉害的 中国古诗词图灵测试 – cslt Wiki 。正常人能把五个字或者七个字码齐了就已经相当不容易了。少数能压韵,再极少能知道平仄。至于能知道按风格选字的,已经万不存一。薇薇现在还不知道用典,很多病句,更没有逻辑。不过这些毛病,现代人一般也看不出来了。换个角度,薇薇已经无法通过图灵测试了,因为人类太烂了。 以后会有一个产业,人购买机器帮自己通过图灵测试,比如复杂的验证码。   无需模仿人脑 人类中心主义思想下,总以为机器要和人比人的强项机器才会超越人。更可能的是机器通过超越人类的弱项超越了人。 在智能问题上,人类还会非常的从人类视角出发产生偏见,总觉得那些对人有意义的问题是难问题,比如人脸识别啊,自然语言理解啊。其实这些东西对于机器系统,压根就是不需要的,它可以直接跃过这些阶段。模仿人的智能很难,超越人的智能就容易多了——就好像模仿鸟的飞行很难,比鸟飞得快就容易多了。如果是目的论的,只看通信产生的效果,那机器语言肯定在未来会超过人类语言。人类语言的语法是基因决定的,很难进化了。 人工智能不需要去追求所谓“真正”的智能是什么,也不需要理解人脑或者猫脑的机理,甚至不需要去模仿人所能完成的“智能”任务(比如说图灵测试)。终极人工智能是要解决机器面临的任务,从目标和手段都和人脑没什么关系。 人工智能最大的作用不是模仿人类,而是把人类智力劳动中可机械化的部分机械化。我们现在纠结于计算机是否可以创作音乐、写诗、打麻将、看病、投资,就和原始人纠结机器是否可以磨制石器、召唤神灵一样。我们纠结的这些问题,在历史长程并不重要。

Skip to toolbar