文杨芬莹
设计黄禹禛
2016/10/6
2016年3月,人工智能AlphaGo 打败世界排名第3的南韩棋士李世乭,虽然出乎各界预料,但胜负战绩悬殊、绝非侥幸。这个难度最高的斗智竞技,人类有可能再度领先吗?若复杂、抽象且牵涉人性的智能活动,计算机能在一年多时间,靠着自我学习,迅速超越人类累积几千年的功力,这对围棋产业意味着什么?
电竞(动)游戏发达的今天,全球有4千万人下着尧舜时代流传下来的围棋,这个古老游戏,棋子不分大小且规则简单,但棋局变化丰富,甚而超越全宇宙的原子种数,最顶尖棋士都无法参透其中奥妙,必须靠着代代承传来累积对围棋的认识。可以说,围棋上的成就,反映着人类智慧的高度直到AlphaGo的出现。
AlphaGo 会赢棋,严格说,不能算是师承人类智慧,没有人为它讲解棋谱、大局观、思维或哲学,主要靠的是自我探索。(注1)
AlphaGo震撼:以实证解放观念思考局限
AlphaGo 怎么学下棋?参考下侧由研发者 DeepMind 释出的人工智能学习范例,影片是计算机学习电动游戏《Breakout》,规则有点像打壁球,控制可左右移动的平台、一颗球,去打掉前方的8排砖块。计算机熟悉规则后持续练习,影片纪录了练习100次、400次、以及600次时,它的破砖技巧,从常常接不到球、零漏接、到开发新技巧——击出一记可连破好几块砖。
相同道理,AlphaGo先从业余玩家的棋谱,掌握棋子配置模式、基本规则后,开始跟自己对下,它不懂围棋十诀、落子顺序或效率等高手心法,而是不断累积实战经验,制定自己的对奕策略:缩小棋步选择(可行解)范围,精算出赢棋机率最高(最佳解)的一步。(注2)
计算机一手棋只需5秒钟,下完一局不到20分钟,而且能在相同与不同版本间同时开战,只要不拔掉电源插头,AlphaGo就是一直玩、一直玩、一直玩、一直玩下去。
跟任何需要透过练习来精通的专业技能一样,围棋功力与对战次数息息相关,与高手对奕次数愈多、进步越快,AlphaGo一星期对局数,轻松超越顶尖棋士一生比赛次数。因而,截至2015年11月相关论文发表之时,AlphaGo已经累积3千万次棋局,棋力足以完败领先的围棋软件、欧洲职业围棋冠军。
接着今年3月打败拥有国际赛冠军次数第二高的南韩棋士李世乭,尽管不乏外界质疑比赛的公平性,但连目前世界排名第一的中国19岁棋士柯洁,赛后都表示,认同 AlphaGo 七成以上棋步决策,也没有全然把握自己就能赢。
说来尴尬的是,DeepMind 研发的人工智能,不是为了打败世界上最聪明的人,而是想找出一体适用的方式,让计算机能够从0开始学习任何知识、技术,透过自我学习,持续地调整与改进。人机对奕只是测试这套系统,能否克服公认最难的智力挑战,AlphaGo变成世界第一围棋高手,只是顺便发生的「意外」,证明它能解决复杂度极高的难题。
震惊、慨叹更不甘心之余,忍不住想问,是否能透过比赛规则的调整,让人类更有匹敌计算机运算能力的公平竞争空间?像是不设对局时限?多人对战?另若让AlphaGo来训练人类,是否有可能青出于蓝?
人类还有机会打败AlphaGo吗 ?
从职业围棋的角度来看,我国第一位世界围棋冠军,目前投身新生代精锐、新锐棋士训练的红面棋王周俊勋原先认为,AlphaGo 不能代表计算机围棋的实际水平(其他计算机围棋都是程序软件,非人工智能),后者尚不足以构成人类威胁,直到近日传来消息称,已有其他围棋软件打败顶尖棋士。
以2016年计算机围棋世界冠军Zen为例,周俊勋2008年开始受邀与Zen对奕,从让7颗子开始,几年来感受到Zen的稳定进步。到今年7月在温哥华、8月底在东京两次(单机版)对奕,周俊勋都让2颗子,第一回赢的轻松,第二回差点输掉。
周俊勋当时认为,要变得像AlphaGo 那么厉害,Zen大概还要2年,毕竟一般软件配备有限,规格比不上拥有庞大资源的超级计算机 AlphaGo。他也因此推估,若李世乭3月迎战的是单机板AlphaGo,结果可能大不相同。(注3)
令人惊讶的是,Zen火速推出硬件强大的版本,9月初释出的Zen19K2单机测试版,在围棋在线对奕网站KGS几乎战无不胜,棋力窜升到业余9段(9d),且据信,打败的诸多选手中,包括一位中国现役排名前10名、拿过世界冠军头衔的职业棋士。这或意味着,人类下围棋的优势,已经被计算机彻底逆转。(注4)
所以,未来人类要下赢计算机,只能靠拔掉插头吗?在人类无法「升级配备」的情况下,是否有更公平、有意义、甚而互利的良性竞争可能呢?在人机对奕(与其他竞争)的领域里,人类除了越输越多、沦为配角,能否化失败为自我突破的助力?
前述「打砖块」游戏的举例,乃机器学习最简单范例,对于机器深度学习有兴趣的读者,可参考概念解说系列影片《Deep Learning Simplified》、或《数理人文》期刊第十期。
过去计算机围棋计算能力强,但不擅长形势判断,人类只要避开局部攻杀,掌握大局就能赢棋。AlphoGo 刚好相反,计算错误不少,但对全局形势判断、布局观念,却优于目前人类最佳水平。一般人视为「臭棋」的烂招、错误落子顺序,AlphaGo却能用来打败李世乭,颠覆了围棋界固有概念,足以证明它对围棋的认识已超越人类。
除了能很好的掌握局势,计算机没有情绪,面对缠斗精神强大的对手李世乭,AlphaGo 无动于衷,它不主动挑起战斗、不贪小便宜、也不冒险地稳步求胜,不给对手任何逆转机会。(注5)
周俊勋说:「AlphaGo 离完美围棋还有很大差距,它赢的是现在的人类。若以100分来形容围棋奥妙、与其完整丰富意涵,人类在过去200年时间研究围棋变化,累积的棋谱与认识,可能只有10分;而投入大量资源、自我训练的AlphaGo,不到2年时间对围棋的认识,大概是12分。」(注6)
至于AlphaGo超越人类多少,5盘棋真的看不出来。它先跟欧洲冠军樊麾下的5局,实力相差太悬殊,棋谱看不出AlphaGo如何应对高手,也让李明显低估事前准备,后来对局过程,李虽尝试多种策略要摸清AlphaGo能耐,5次交手实在不够,何况第四局程序计算频频出错,AlphaGo 在仍有可为的情况下弃子投降。(注7)
产业冲击的样貌?
无论如何,AlphaGo颠覆了人类代代传承的围棋思路,让人清楚意识到原有思考的局限,刺激许多职业棋士的自我反思。李世乭的落败,让南韩人大受刺激,据闻一口气增加了10多万人报名学围棋,中国也有顶尖棋手,开始尝试更加奔放、不可预测的下法。那种启发几分类似已故围棋大师吴清源1930年代与棋士好友木古实,从实证方式探索「新布局」的可能性,进而带动日本围棋革命性进展。(注8)
五番棋后,周俊勋也思索,过去以为自己比赛成绩不好,是因为天分不够、努力不足,会不会其实是下棋观念错误?老师长辈们教的,可能只是偷懒、方便(容易赢棋)却不见得正确的方式,反而限制了其他可能?这样的反省也影响他的教学,现在纠正年轻棋士「臭招」时,他态度更加谨慎。
AlphaGo颠覆性的表现,开始影响人类下棋与教棋,图为周俊勋(中)指导年轻棋士下棋。(图/海峰棋院提供)
若有机会跟AlphaGo这样强大的老师学习,周俊勋相信,「职业棋士棋力可以像科技一样快速进步,也许5年、10年间就可以抵上过去100年,也可以打破许多固有的僵化概念。」至于更公平的比赛方式?周俊勋认为,从切磋角度来看,最好不要严格限制对局时间,也许回归日本赛制、或让更多顶尖棋士共同对战。至于教棋并不合适,因为AlphaGo不讲话也不会解释,程度浅的人看不懂它的棋。(注9)
人类除了打不赢AlphaGo,其他计算机软件也可能很快突破技术盲点,追上足以打败顶尖棋士的棋力。一旦厉害软件越来越多,超越并逐步拉开领先距离,几千年来「最聪明人类」的光环,拱手让给计算机程序设计师,或像西洋棋那样,开始有顶尖大师想靠作弊赢棋、拿奖金(注10),那对围棋产业——尤其是台湾围棋产业——会有何影响?
相较于中、日、韩围棋三大国,围棋产业在台湾,存在冷热两极的奇特现象。台湾围棋人口号称有150万,儿童围棋尤其盛行。一方面,围期对于心算、空间概念、逻辑判断等智力锻炼、专注力与抗压力的培养,效果非常显著,下棋的孩子通常功课都不差;另一方面,目前台湾的多元入学制度,多会一项才艺,有助于申请理想高中与大学,所以家长多抱持着鼓励态度。
学棋需要找人多下,所以民间围棋活动兴盛,每年业余比赛超过200场,寒暑假几乎天天都有,上千人参赛稀松平常,加上陪同亲友,场面非常热闹。无论乡镇市政府、各级学校、宗教团体、围棋协会等任何机构主办,不乏愿意出资的赞助商,需要缴交报名费的比赛,还有一定获利空间。棋力高的业余选手,每年能拿到6位数字奖金。
围棋人口包括了解围棋基本规则、下过棋的人口,资料取自近1年报导、围棋论坛评论、新发表的研究论文《大数据时代台湾围棋社群之发展规划》,惟表列数据并无确切统计,进一步引用时请多加注意。
业余比赛热况造就不少天才少年,常在国际比赛取得佳绩(注11),可以说,台湾业余围棋选手实力,在国际间相当领先。然而,这些业余高手、甚至天才儿童一旦进入职业围棋领域,国际赛表现却总是有气无力,周俊勋2007年拿下LG杯冠军后,截至目前最好的成绩是陈诗渊于2011年打进LG杯8强。
国际赛成绩落后中日韩的原因,则明显出于台湾职棋环境的冷况。不像日本、中国的职业棋士有底薪保障,台湾跟南韩棋士一样,必须靠比赛累积收入(奖金、对局费),或是谋求其他出路,如转型教学、推广、或断然转行。在新闻棋赛(注12)、企业赞助棋赛陆续停办后,目前国内7个职业棋赛,总奖金不到1千万,只有成绩前4名的棋士,才能靠比赛奖金过活。
多数棋士迫于生计无法专心下棋,自己进步有限、也导致棋士相互磨练强度不足,国际赛更难发挥。恶性循环的情况下,家长或宁可把有天分的孩子,送去日本、中国或韩国发展,或是希望孩子「兼顾」学业,不过,准备职业赛必须全心全意,顾学业基本上就顾不了围棋。
除了发展环境不理想,职业等级的围棋比赛,并非雅俗共赏的节目,没有业余高段以上的棋力,一般人看不懂、也不可能听得懂讲解;意思是,台湾150万围棋人口中,可能只有业余初段以上的2万多人、1到9级的17万人,才能体会观赛的趣味。若围棋已经无法代表人类最难智力挑战,心怀崇敬的关注群众,是否会逐渐散去?也让追求棋力巅峰的职业围棋,在台湾加速边缘化?
台湾职业围棋产业概况。
王铭琬:该好好思考围棋的本质
同样长期关注计算机围棋发展的我国旅日九段棋士王铭琬,对于AlphaGo出现后,围棋产业可能出现的冲击与困境,他认为,原因不在于人类再也赢不了计算机,而是围棋还未发展出完整语言、基本论述,要思考将来与生存问题,围棋必须先建立自己的语言。
围棋没有语言吗?棋谱、讲解或典故,不就是它的语言吗?王铭琬眼中,现有说明方式,称不上论述语言。目前,一场围棋比赛的解说,都是奠基于棋谱的语言,不(太)会下围棋的人根本听不懂。
棋盘上每一步,反映的是下棋人的思考、受过训练等个人内涵,否则就不会有那一步棋。棋谱只是非常简略的记号,不足以表达下棋过程的内在思维,即便是旁观者的说明讲解,也有很大一部分出自个人想象力(脑补),只是过去大家都接受这种方式,也相信归纳出来的下棋原则。(注13)
AlphaGo出现以后,完全推翻了过去认定的正确原则,棋谱上各个棋步,出现了与以往完全不同意涵。可以说,AlphaGo切断了棋谱与传统诠释的关连性,王铭琬相信,那会把围棋推进一个全新的时代。
他解释,职业棋士制度是历史的偶然,日本人建立了这个制度,发展的成功,吸引其他国家模仿。这种制度下,职业棋士被视为产业金字塔的顶尖,整个产业都在支持他们追求棋力最高境界,连下棋规则,都是为了让棋力高的人更好发挥,业余围棋的目的,也是为了支撑职棋发展。棋士们认为,自己为人类最高智慧而战斗,观赏者也以为,围棋象征是人类最高智慧,在AlphaGo出现以前,确实是如此。
「追求最高境界」是围棋产业的最重要目标吗?王铭琬强调,围棋本质在于两方对奕、交流过程的乐趣,不一定要追求最高境界。台湾业余围棋的健壮发展,王铭琬形容是「很伟大的事情」,不必因职棋表现不够强而自卑。
职棋成绩不如中日韩三国,一直是台湾围棋圈的痛,也让棋士们处于长期焦虑,自责努力不够、或还没培养出更优秀一代,这样困境王铭琬感同身受,他认为台湾职棋能有目前发展,实在太不容易了,也没办法强求,若只以最高境界当目标,就会觉得失败、做的不够。
多次拿下本因坊头衔的王铭琬,一直不认同围棋界「追求棋力高点」的方向,AlphaGo靠着处理技术,轻易打赢人类,正是产业反思追求目标的最好时机。他打趣说:「你搞了半天,有什么用?对不对?」他不是说围棋没有用,而是意义不一样了,那不是缺憾,更像是朝正常方向走的契机。
他主张,围棋产业不该是高塔,应该是主题乐园,可以有挑战极限的云霄飞车、也该有不分年龄的旋转木马、鬼屋,进去的每个人都可以享受适合自己的乐趣。因此,经营者是否要集结一切资源,拼命增加云霄飞车的高度?其实这座云霄飞车、比别的云霄飞车低一点,一点问题都没有!(想更了解王铭琬看法,请看其评论《 AlphaGo大胜棋王后人类的下一步?》)
无论产业应该走哪个方向,围棋需尝试建立非全知全能观点、属于人的论述语言,让下棋、不下棋的人能够更有效沟通,能够更有效地研究围棋、厘清围棋本质与真实价值,并且打破过去隔绝外界的藩篱。王铭琬相信,一旦围棋有了自己真正的语言,能够论述、探讨所面对的问题,就会更清楚该如何面对困境。
威胁人类的或许是固有价值观
面对计算机威胁的,当然不只有围棋产业,每隔一阵子,就有评论者发出警告,更多工作要被机器取代了,从生产线作业员、运输业司机、档案整理、到收银出纳等,AlphaGo出现后,似乎多数靠脑力过活的知识工作者(白领阶级)都饭碗不保。
小时候曾经是备受期待的围棋神童,目前在国立台北大学金融系任教的施懿宸,同时拥有围棋与金融的专业,他认为:虽然在围棋上,人类输了,但是不代表人工智能在所有领域皆可以击败人类进而取代人类,这还是一个正在探讨的议题,还没有一个完整的答案。
一直以来,围棋产业金字塔顶端的荣誉与财富,属于棋力最高的棋士,就像绝大多数产业也把财富与生产效率划上等号,绩效好才有资格要求高报酬。但如今,人类的一切活动,效率皆落后计算机,若不检讨过去的价值与报酬衡量标准,等待着我们的未来,恐怕不容乐观。
(本文同步刊登于《数理人文》期刊第十期)
输给AlphaGo以后,人机对奕的价值再探索人工智能有多恐怖?听听「天才」Demis Hassabis 怎么说!
· 2016/2/21
· 【合作媒体tech2ipo】
本文来自于:the guardian《The superhero of artificialintelligence: can this genius keep it in check?》,由 TECH2IPO 编译,INSIDE 获授权转载。
现年 39岁的Hassabis 除了是一位国际象棋大师以外,还是一名电子游戏设计师。由他一手创立的人工智能企业「DeepMind」在 2014 年被 Google 以 6.25 亿美元的价格收购。 Demis Hassabis 的父母都是新移民,他曾就读于 Finchley 的综合学校,后来分别在剑桥大学(Cambridge University)和伦敦大学学院(University College London)取得了计算器科学和认知神经学专业学位。同事纷纷表示 Hassabis 是一位很有远见的管理者,他认为自己成功找到了一种能让科学研究更具效率的方式,而且坚信自己是「 21 世纪阿波罗计划」(Apollo)的领导者。 Hassabis的长相非常平凡,倘若在大街碰到你绝对不会再多看他一眼。但「互联网之父」Tim Berners-Lee)却坚信 Hassabis 是这颗星球上最聪明的人之一。
人工智能技术已经来了?
人工智能技术已经来到了我们身边,我们时常接触的 Siri 和 Android 设备上的语音助手就是最好的两个例子。在短期内, Google 的产品将会成为 Hassabis 研究成果的最早受益者,尽管个性化产品,智能化搜寻, YouTube 、智能语音和脸部识别等领域在严格意义上并不属于人工智能的范畴。「仅仅是软件,对吗?」 Hassabis 笑着说道,「反正就是一些能运作的东西。」
从更长远的角度看来, Hassabis 正在开发的技术所覆盖的范围绝不仅仅是情感机器人和智慧手机,也绝不仅仅是 Google。不甘落后的 Facebook 、 Microsoft 、 Apple 等科技巨头也在大肆吸纳人工智能领域的人才,这些公司已经在该领域投入了数十亿美元。人工智能技术所带来的颠覆性势必会超乎所有人的想象。
确实,这一切听起来难免有种野心勃勃的感觉。绝大部分人工智能系统都相对比较狭隘,预先编程完毕的媒介只能处理特定领域的任务,对其他领域则并不擅长。由此可知,尽管 IBM 公司的「深蓝」(Deep Blue)能够在围棋上胜过世界冠军 Gary Kasparov ,但它在「三子棋」游戏中甚至不能打败一个三岁的小孩。而这一次, Hassabis 却计划从人类的大脑中获取灵感,期望打造出第一款面向多种用途而且可以自主学习的人工智能机器。这款机器所使用的算法非常灵活,足以适应周边的环境,这意味着它完全可以像生物系统一样进行学习。只需接触到原生数据,它就可以从零开始学习技能。
这项技术被称为「人工通用智慧技术」,重点在于「通用」二字。 Hassabis 认为,在将来具备超高智能的机器人将会和人类的专家连手解决所有的难题。「不论是癌症、气候变化、能源、染色体、宏观经济、财务系统还是物理范畴,我们需要掌握的系统正变得越来越复杂。」他表示,「面对无穷无尽的讯息,即便是最聪明的天才穷尽一生也很难处理完毕。在这种情况下,我们应该如何在信息的汪洋中筛选出有用的讯息,以帮助我们解决问题呢?所谓的人工通用智慧技术,其中一个用途就是将没被结构化的数据转化为可用讯息。我们所研究的是为所有问题的源解决方案。」
万能的源解决方案距离我们或许还有数十年之久,但我们无疑正在朝着这个目标迈进。在 2015 年 2 月,权威科学杂志《Nature》在封面刊登了一篇关于「具备自主学习功能的人工智能软件在电子游戏上取得了和人类相近的表现」的报导,并为该篇报导配了《太空入侵者》游戏的图片。据报导,DeepMind 公司所发表的论文表明其人工智能产品配备有第一款真正意义上的「端对端」学习系统,这款产品的人工智能媒介(一款被称为「Deep-Q 网络」的图像处理组件)已经学会瞭如何处理屏幕上的数据输入。在完全弄懂数据输入之后,这款产品会自行采取行动以便实现期望的结果。在报导中,这款人工智能产品在 2,600 款经典游戏中都取得了骄人的成绩,这项突破震惊了整个技术界。
随后在上一个月,DeepMind 公司再度登上了《Nature》杂志的封面。在短短几个月内,这家公司再度实现了一项伟大的成就。这一次,他们的测试机床不再是 70 或者 80 年代的经典游戏,而是把目光放到了拥有超过 2,500 年历史,甚至曾被孔子提及的围棋上面。围棋分支系数的体量非常庞大:它所蕴含的可能性的数量甚至比整个宇宙的原子数量还多。而且和国际象棋不同,围棋所依靠的并不是单纯的计算。让人感到雪上加霜的是,开发人员不可能为围棋设计出评价函数,他们不能通过算法集合表述哪一方正处于领先位置,比劣势方领先多少等情况。围棋所依赖的更像是人类的「直觉」:每当被询问为何采取特定的行动时,专业棋手总是会给出让人感到模棱两可的答案,例如「感觉就该这么下」。
众所周知,计算机一直以来在直觉方面的表现并不是那么优秀。正因为如此,围棋一直被视为人工智能技术难以攀登的一座高峰。研究人员甚至曾悲观地预测,计算机想要攻克围棋至少需要再过十年的时间。
但在上年秋季的一次秘密比试中, DeepMind 公司的全新人工智能算法「 AlphaGo 」却以 5 比 0 的绝对优势击败了 3 度蝉联欧洲围棋冠军的樊麾。在今年 3 月, AlphaGo 还将迎战世界冠军李世乭。 Imperial College 认知机械人学专业的 Murray Shanahan 教授认为这是一项惊人的成就。超人类主义哲学家 Nick Bostrom 也认为AlphaGo 所取得的成果具有里程碑意义,他在《超级智慧:路线图、危险性与应对策略》一书中写道,倘若人类真的成功研发出人工通用智慧技术,我们的世界将会迎来前所未有的改变。或许我们应该借用 Google 公司技术总监 Ray Kurzweil 的观点,他认为人工通用智慧技术甚至有可能会改变我们的历史进程。「 AlphaGo 所取得的成就完全是戏剧性的,它是过去数十年来机器学习领域的集大成者。」 Bostrom 在 University of Oxford 的人类未来研究所中说道。
「不错,这确实很酷。」Hassabis 对 Bostrom 的观点表示同意。和往常一样, Hassabis 的穿著毫无特色可言,还是黑色的上衣、长裤和鞋子。据说 Google 向 Hassabis个人支付了 8,000 万美元的资金,但不得不说,他给人的感觉更像是一位实习生。「围棋是棋类的至尊,它代表着棋类的高峰。就玩家所需的智力深度而言,围棋更加是纬度丰富的代表,这个游戏非常容易让人着迷。但更让我们感到激动的是,我们不仅仅是本人掌握了这个游戏,我们还能通过有趣的算法来对这个有趣的游戏进行操作。围棋所蕴含的艺术色彩要浓于科学色彩。」 Hassabis 说道,「围棋的玩法非常贴近人类的风格,人们可以通过贴近人性的方式对其进行学习,并在实践中进步。这就是我们人类学习围棋的方式。」
也许Hassabis 看起来就像是一个学生,但在说这些话时他的脸上却洋溢着骄傲父母的神情。在他的职业生涯中,围棋是最让他感到兴奋的事物。「围棋的顺序和量级都远超人们的想象。」他热忱地说道,「更让我们感到兴奋的是,我们的系统和那些需要人工设置规则的专家系统不同,它可以运用通用的机器学习技巧自学围棋。在以后,我们希望可以将这些技术应用到气候建模和病毒分析等复杂的现实问题上。每次只要想要这点,我们都会感到格外激动。」
Demis Hassabis 何许人也?
点击分享到









