新上线的ChatGPT迅速成为了现象级的AI应用。它代表了AI技术怎样的飞跃进步?它的出现又将颠覆现有的哪些应用?本文以ChatGPT实际使用案例详细分析了这款应用的技术路线,以及它在信息搜索可能引发的颠覆性影响。希望能给你带来启发。
这两天,新上线的ChatGPT实在是太火了!首富马斯克一马当先,带着大家玩得不亦乐乎,看起来,人工智能的奇点就要到来了!没玩过的朋友,我也不多作介绍了,自行搜索即可。
(相关资料图)
作为一名二手人工智能从业者,好多人催我写写,人类是不是悬了?当然,人家源代码我没地看去,看了没人给讲也是一头雾水,外面那些信息,我看也半真半假。
所以,咱们也不讲什么技术框架,就从实际的使用案例来看看,这款现象级的AI应用,采用的是什么样的技术路线,能颠覆现有的哪些应用。
篇幅有限,今天只聊以下几个问题:
这次的ChatGPT,为啥一下子这么猛? 这家伙准备先颠覆谁,是搜索引擎么? AI关底的图灵测试,马上要被KO了么?
一、ChatGPT这次为啥这么猛?
与其前一代相比,ChatGPT的效果太惊艳了!大家体会最深的一点,是机器人说的“像人话”了。这个像人话,有两层意思,首先是对一些知识性内容的回答准确率大大提升,这个例子就太多了,咱们随便贴两条:
您看这专业程度,至少比问我靠谱!它反映了什么技术进展呢?
自然语言处理的大模型,一直有个问题:如果完全无监督训练,无法甄别语料的真假和质量;这次ChatGPT从回答质量上有质变,应该是对某些高质量内容做了加权,采用了类似有监督训练的方法。从结果上来看,是相当成功的。
最让我感到惊讶的,是ChatGPT这次在伦理方面给出了诸多令人称赞的限制,不用说,这肯定也得有点监督。除了大家熟悉的“未来预测类问题不作答”以外,下面这两个例子的对比,也相当出彩:
除了内容,ChatGPT回答的条理性和语言流畅度也特别好。基本上会把各方面的信息综合成一二三点的模板,颇有点领导讲话的派头。因此,我认为在语言生成的结构上,也应该是特意选择了一些高质量的严肃帖子,同样采用某种程度的有监督学习。
所以您也能看出来,它说话老是脖子冲南脸冲北的老干体,一点儿也不像在论坛里混出来的语言风格。
后来有消息说,ChatGPT这回采用了强化学习的方案,而强化的具体做法,就是找几个人盯着结果标注,这本质上跟有监督意思也差不多。
二、ChatGPT将首先颠覆谁?
那么,ChatGPT是不是能够如很多人所期盼的那样,成为搜索引擎的杀手呢?
熟悉搜索的朋友应该了解,搜索查询分为两类:信息型搜索(Informational search)和浏览型搜索(Navigational search),咱们分别来看看。
信息型搜索,就是要找某个具体的信息或知识,要求当然就是准确、清晰。从清晰性来说,ChatGPT给的这种结构性呈现,比传统搜索引擎强多了!可是从准确性来说,坦率地说,目前还差点儿,经常会有些似是而非回答,关键是——人家还倍儿自信:
特别是中间那个,给我气乐了:要这么找富婆,恐怕活不过正月十五!
再来说说浏览型搜索,说白了就是用户给个关键词用搜搜引擎帮忙逛街呢,这时候不要求信息每条都准确,但是全面性和实时性很重要。
拿实时性来说,这个模型目前还是做不到准实时更新的,并且可能因为训练成本相当高,目前其信息的横截面,应该还停留在去年的《纽约时报》。
从语言相关的信息覆盖度来看,ChatGPT说只有英文语料,中文的问答都是通过机器翻译转换成英文进行的。这一点也通过实测得到了验证,如果要用到只有中文语料中才有的背景知识,它基本上回答得是驴唇不对马嘴的:
所以,总结一下:我认为ChatGPT对于搜索引擎来说,肯定算是一个重要对手了。只不过,由于用单条回答替代了信息罗列,对准确性的挑战相当大,目前还是任重道远;另外,现有的技术栈看起来还不能支持准实时的信息索引,这对其实用性限制非常大。
(顺便说一下,关于秦明夜走瓦砾场的事儿,普遍认为是被宋江所害,然而金圣叹认为,是花荣出的主意。)
然而,目前的ChatGPT,替代维基百科、Stackoverflow这种非实时专业信息社区,前景十分光明。这不,Stackoverflow应该已经感到了寒意,开始禁止上传ChatGPT生成的内容了。
当然,对那些情绪性、非专业性的图文社交网络,比如微博、Twitter,这么个说话人五人六、又不知疲倦的机器人,很可能给整个社区内容生态带来巨变,那就不是颠覆了,有可能直接就给干挺了!
三、图灵测试要被通关了么?
最后,再说说图灵测试的事儿。
ChatGPT一出,有群众惊呼:图灵测试要被终结了!我的看法是,这恐怕还是大大言过其实了。
图灵测试的标准,其实远超普通人的想象。要想让计算机聊一会不露馅儿,关键并不在于写代码、问攻略这些专业问题,而在于人类看起来非常浅近的一些日常聊天。
会聊的人,聊一两句对方就现原形了。比方说,我问ChatGPT的这两个问题,您看看它怎么回答的:
前一个问题,正常的人类回答多半是:“你为啥会关心1.25亿这个奇怪的数啊?”
后一个问题,正常的人类回答应该是:“这事儿哪能提醒领导,多尴尬呀!”
看到这两个问题的回答,我知道,虽然ChatGPT在理解和表达上已经取得了长足的进步,但是一些核心的困难点还是如常,并不容易解决。
当然,也没必要要求人工智能一定要通过图灵测试,即使通过不了,它潜在的商业应用场景也很多了。只是,客观地说,在目前的技术栈和方法体系下,通过图灵测试,短期内我认为还看不见希望。
毫无疑问,ChatGPT是人机自然语言交互的一个重要里程碑,并且已经具备了在非实时、专业性知识领域替代原有社区和垂直搜索的巨大潜力。
当然,客观地说,就目前的状态而言,如果说它就能替代搜索引擎,甚至通过图灵测试,那无疑是过于乐观了。
大家不要误会,我可并不是唱衰ChatGPT!恰恰相反,我觉得这玩意应该早点商用,随着大量用户反馈的累积,质量的提高很可能一日千里,适用的场景也越来越多。只是,就像咱们一开始分析的,如果在大规模的用户反馈中甄别高质量语料,实行有监督的模型进化,可能还真是个挑战!
当然,作为一个老码畜,看到ChatGPT写的哪些程序,我是为很多码农朋友的未来捏一把汗的。怎么样,你的后脊梁发凉了吗?
关键词: 爆火的ChatGPT 先颠覆谁 图灵测试 stackoverflow
最新推荐
新上线的ChatGPT迅速成为了现象级的AI应用。它代表了AI技术怎样的飞跃进步?它的出现又将颠覆现有的哪些...
华夏时报(www chinatimes net cn)记者 帅可聪 陈锋 北京报道南京越博动力系统股份有限公司(下...
12月10日,一汽-大众邀请世界滑雪冠军徐梦桃和媒体专业车评人,与硬核大五座SUV揽巡共赴张家口崇礼太舞...
文旅部:进入图书馆、文化馆可不查验核酸检测阴性证明和健康码
12月9日,中国汽车动力电池产业创新联盟发布数据显示,今年11月国内动力电池装车量为34 3GWh,同比增长...
12月9日,理想汽车发布财报显示,今年三季度营收93 4亿元,同比增长20 2%;交付量达2 65万辆,同比增...
期货交易平台哪个最可靠期货交易平台最可靠可以参考证监会给出来的期货公司的等级资质排名为AA的期货公...
基金分红会降低持仓收益率吗基金分红不会降低持仓收益率,因为,基金在分红之后,会根据其所分的红利,...
基金卖出后本金还有吗如果投资者选择全部赎回的话,赎回的钱里面是本金加上收益的。基金实行T+1交易,交...
买基金最多能亏多少钱?买基金最多就是亏光本金,但这种情况还是比较少见的,因为在买基金的时候,当基金...
在哪里买基金最划算投资者购买基金主要通过基金公司、银行、证券公司、第三方平台这几种途径,不同途径...
为什么有些基金只能买入不能卖出有的基金不能买入,一般来说,只有短期才会出现这种情况,可能是由于基...
基金如何判断止跌企稳投资者可以根据以下方法来判断基金止跌企稳:1、根据标的物走势来判断基金走势受标...
认购和申购基金的区别如果您通过招商银行购买基金,认购和申购的区别如下:认购:新发售的产品在第一次...
每人可以开通几个证券账户一个人能开3个有效的证券账户,3个以上的证券账户不能交易沪市的股票,此外可...
如何在证券公司开户现在炒股的人相当多,而要炒股的话,首先就得开户,你可以直接在网上开户,也可以去...
近日,第十九届中国科学家(国际)论坛圆满落幕。来自全国各地的院士、科学家、教授、学者、科技工作者...
中考分数查询时间考试完20天之后出来。具体中考成绩公布的时间要根据考试时间来推算,一般20天以后成绩...
学文科是不是废了文科不是没前途。可能相对于理科而言,文科生不论是大学选专业的机会还是将来进社会就...
阳泉中考分数线多少阳泉市第一中学校,第一批统招生,总分711 5,语文100。第二批统招生城区,总分620...
寒假用英语怎么说1、寒假 winter vacation。2、释义:寒假 winter vacation;winter holiday 寒假。3、例句:Yesterday was the fi
中考成绩什么时候出来中考成绩一般在考完半个月到一个月左右可以出成绩。各省、直辖市在中考的时间上会...
仁者乐山前一句是什么?智者乐水智者乐水,仁者乐山;智者动,仁者静;智者乐,仁者寿此句出于孔子的《论语·...
对世界上每个父母而言,育儿没有标准答案,但面临的问题却普遍相似,初为父母的冲击、育儿中的孤独、协...
在国内怎么玩美服魔兽打开你的国服WOW文件夹,找到一个叫realmlist wtf的文件,然后用记事本打开,你会...
魔兽世界古伊尔是谁古伊尔是传奇兽人英雄萨尔的真名,是兽人霜狼氏族领袖杜隆坦和他的妻子德拉卡唯一的...
vob格式怎么剪辑现在编辑软件都不认VOB格式的视频 因为它是光碟的格式 所以你需要下载一个格式工厂先...
jovi incar支持哪些车型在支持Jovi智能车载的手机中,进入手机【设置>其他网络与连接>智能车载>连接车...
当下,健康成为了人们重点关注的话题。可是,在日常生活中,由于长期进食富含饱和脂肪酸及胆固醇的食物...
国产手游《原神》获评2022TGA“玩家之声”奖
英雄联盟全明星赛取消2023赛季将以启航赛代替
阿维塔11搭载了华为ADS智能驾驶辅助系统,采用视觉加激光雷达融合感知方案,华为 Mdc810计算平台算力达...
2022国际CMF设计奖获奖作品及奖项授予名单于近日隆重揭晓,箭牌家居ORI系列搓淋按摩花洒荣获产品类金奖...
大衣哥儿媳妇是谁?大衣哥的前儿媳陈亚楠,曾经是一个名不见经传的小护士,正是嫁到大衣哥后才成为了大网...
麒麟950相当于骁龙多少麒麟950综合相当于骁龙820左右,或稍微差一些,因麒麟950并不均衡,cpu挺强,但gp...
西安孕妇流产事件2022年1月6日,据西安发布客户端消息,西安高新医院发生一起孕产妇流产事件引起社会广...
望奎县属于哪个市望奎县属于黑龙江省绥化市。望奎,史称双龙城,位于黑龙江省中部,松嫩平原腹地。县界...
2022年是首都北京培育国际消费中心都市的一周年,双合盛精酿啤酒独家冠名的《京城十二时辰》第二季用一...
近日,家住济南市历城区的周先生反映,他所购买的中粮祥云楼盘新房延期交房,但要求业主签订包含“放弃...
2022年1-10月,金科累计完成199个交付批次,总交付面积约1019万㎡,超60000户业主加入金科大家庭。
抛光打蜡对车漆伤害大吗汽车抛光打蜡对车漆既有好的一面,也有坏的一面。比如在抛光打蜡的时候,会对车...
车膜应该怎么选择车友们在选择车膜时,首先选择车膜的品牌,一般情况下,大品牌的车膜都不会差,在质量...
前挡膜透光率达到多少最好前挡风玻璃贴膜,保护膜透光率必须要超过75%,其他的玻璃贴膜的透光率也不能低...
保险杠喷漆需要多久一般情况下,保险杠喷漆快的话需要1天,慢的话要2天。根据保险杠的擦碰程度,4s店会...
汽车封釉多少钱一次汽车封釉一次大概需要400-2000元左右,具体的费用与每个地方的消费水平,以及选择的...
玩溜早餐荟|携程推“2023旅游振兴A计划”加速抢市场;多家京郊滑雪场周末前密集“开板”;北京环球影城...
数字经济如今已渗透人们的生活和各行各业,数字化转型成为企业发展的必然选择,也是经济发展的重要驱动...
别克君威油耗多少真实油耗别克君威百公里真实油耗在8 33-9 37L左右。另外,汽车的真实油耗根驾驶员的...
别克suv有几款车型目前,别克SUV车型有:昂科旗、昂科威S、昂科威、昂科威Plus、昂科拉、昂科拉GX和微蓝...
迈巴别是别克的哪一款迈巴别指的是别克旗下的双门轿跑君威,因其与迈巴赫相像,所以被戏称为迈巴别。外...
想收房要签协议放弃索赔,济南中粮祥云延期交付惹争议_环球速递
联系我们:55 16 53 8@qq.com
关于我们| 联系方式| 版权声明| 供稿服务| 友情链接
华讯网 版权所有,未经书面授权禁止使用
Copyright©2008-2020 By www.saibeinews.com All Rights Reserved