导读:我们在人工智能技术及产业发展上依然任重而道远,须臾松懈不得。
2/13/2023,光纤在线讯,五天超过百万用户,两个月获得上亿用户。ChatGPT的火爆肉眼可见,这家企业的创始团队包括马斯克和彼得·蒂尔等知名大佬,后又背靠微软,从微软获得了数据(比如微软小冰采集的对话数据、GitHub的开源代码库)、算力(微软Azure是全球前三的云服务供应商)、资本(微软数轮入资,今年还将投资几十亿美元)等方面的支持,可以说整个硅谷的资源都被调动起来,聚焦到ChatGPT身上。
ChatGPT的优势在于,它真的有用。之前很多人将人工智能叫做“人工智障”,因为其他人工智能往往答非所问,或者你要按照人工智能习惯的方式来提问才能得到正确答案,而ChatGPT具备上下文语义理解能力和逻辑能力。如果你问的问题它不懂,它就会向你反问,要你补充问题的信息,最终通过一问一答找到你真正需要的答案。
在文本创作、知识数据搜索和代码书写等方面,ChatGPT都有优于谷歌等搜索引擎的用户体验,这让在AI领域深耕多年的谷歌艳羡不已,也让其他一众聊天机器人黯然失色。而一旦用户数量达到一定规模,通过用户的提问,在线数据将支持ChatGPT的数据训练集进一步丰富。可以说ChatGPT让AI达到了一个奇点,而这个奇点之后有可能是一轮AI领域的“宇宙大爆炸”。
国内也有很多聊天机器人,但与ChatGPT相比,还有很大差距,大多数国内的AI应用是一问一答,且有的时候还会误解用户的意思,让人啼笑皆非。国内的AI应用为什么会和美国的ChatGPT拉开差距呢?原因是多方面的:
其一,从技术资本层面,最大的限制来自算力、算法、数据。
算力方面,我国的数据中心多面向软件应用环境,比如游戏服务器外包,真正面向AI的算力非常少。而算力本身是非常昂贵的,模型越大,数据越多,数据训练AI所要消耗的费用就越多,一次集中算力训练需要几百万美元的算力,这是国内AI公司不能负担的。
数据方面,国内数据的质量普遍不高,一方面是因为数据本身积累上的问题,比如小冰用免费AI对话来积累数据,比如GitHub这样的代码开源网站比较缺乏。另一方面是因为数据管理较为严格,部分数据文本需要审批才可以被人工智能企业使用,减慢了数据价值的释放。
算法方面,我国AI 开发者有思维惯性,过度依赖开源内容,对大模型缺乏探索创新。当然,算力、算法、数据的问题有些也是资本问题,没钱导致没办法进行大模型、大数据量的训练,但有些也是管理需要改进的地方。
从管理层面来看,数据要素流通需要进一步打通,除此之外,我国对AIGC的内容创作也要采取开放包容的态度。AIGC作为技术黑箱,其产出的内容往往是不可知的,在输出内容方面要允许AIGC犯错误,让AI企业敢于在技术上突破。
综上,一方面要堆钱,算力、算法、数据都要钱。另一方面要松绑,宽松的环境能够让技术的生长速度更快。但短期内比较迫切要做的事情是,如果ChatGPT 开源,当然皆大欢喜,国产势必跟上;如果ChatGPT不开源,我们是否应该引进ChatGPT。引进ChatGPT的理由有两个:一个是看ChatGPT是否在国内存在合规障碍,如果ChatGPT可行,国内企业就可以模仿;另一个是ChatG-PT对代码写作和内容创作来说是一种生产力工具,能够提高内容产量。
当然,实事求是地说,中国人工智能近些年的进步是巨大的。当前,全球人工智能发展呈现出中美两国引领、主要国家激烈竞争的总体格局。中国人工智能发展成效显著,人工智能创新水平已经进入世界第一梯队,与美国的差距进一步缩小。但中国在人工智能人才方面仍落后于美国,中国在人工智能基础学科建设方面不及美国。
而ChatGPT热潮席卷全球的背后,也带给我们深刻的思考,人工智能作为未来产业、经济社会发展中的一项变革性技术与关键性力量,深刻影响着未来世界的竞争格局。于中国而言,在人工智能发展领域并非到了“刀枪入库,马放南山”的阶段,反而恰恰如中国的一句俗话所说:“逆水行舟,不进则退。”所以,我们在人工智能技术及产业发展上依然任重而道远,须臾松懈不得。(作者系浙江大学国际联合商学院数字经济与金融创新研究中心联席主任、研究员,工信部信息通信经济专家委员会委员)
(来源:人民邮电报)
光纤在线公众号
更多猛料!欢迎扫描左方二维码关注光纤在线官方微信