扫描打开手机站
随时逛,及时抢!
当前位置:首页>综合资讯>

“图灵测试已过时,AI 能不能赚大钱才是新标准”,来自 DeepMind 联创

“图灵测试已过时,AI 能不能赚大钱才是新标准”,来自 DeepMind 联创

时间:2023-06-23 15:23:01 来源:网络整理 作者:bianji123

全新图灵测试,评估AI赚钱能力!

这是联合创始人提出的“新想法”。

他认为原来的图灵测试已经过时了。

毕竟前段时间,AI21 Labs推出的“社交图灵游戏”已经积累了数千万次这样的测试。

玩家需要在2分钟的对话结束后区分参与对话的对方是人类还是AI。 结果,27%-40%的人判断错误。

面对这种情况,我认为“智能”的定义不能仅仅委托给大企业,因此应该设计一种新的衡量人工智能智能程度的方法。

给一个人工智能 10 万美元,让它赚 100 万美元,以证明自己足够聪明。

思考:

人工智能研究需要关注短期发展,而不是像通用人工智能(AGI)那样遥远的梦想。

正如优秀的资本家很聪明一样,只有真正聪明的人工智能才能让“利润曲线上升”。

据彭博社报道,他还将在他即将撰写的一本书中讨论如何根据人工智能的赚钱能力来判断人工智能的智能水平。

ACI是现阶段人工智能的“北极星”?

在即将出版的书中,他驳斥了传统的图灵测试,并认为“尚不清楚这是否是一个有意义的里程碑”。

这并没有告诉我们系统可以做什么或理解什么,或者它是否具有复杂的内部思维,或者它是否可以在抽象的时间尺度上进行规划,而这些是人类智能的关键要素。

20世纪50年代,艾伦图灵提出了著名的图灵测试,提出用人机对话来测试机器的智能水平。 在测试过程中,人类评估者需要确定他们是在与人交谈还是与机器交谈。 如果评估人员认为他们正在与人(实际上是机器)交谈,那么机器就通过了测试。

△ 来源:维基百科

提出的新想法不是将人工智能与人类进行比较,而是建议将短期目标和任务分配给人工智能。

我们坚信,技术界不应该过多关注实现通用人工智能(AGI)这一雄心勃勃的目标。 相比之下,他主张追求更实际、更有意义的短期目标,即他所倡导的“(ACI)”。 简而言之,ACI 表现为设定目标并完成复杂任务的能力,同时最大限度地减少对人为干预的依赖。

测试方法就是我们一开始提到的,给AI 10万美元的种子投资,看看能不能增加到几百万美元。

为了实现这一目标,人工智能必须研究电子商务商机并能够生成产品蓝图。

不仅如此,还可以在阿里巴巴等网站上找到制造商,然后在亚马逊百思特网或沃尔玛等百思特网网站上销售,并提供详细准确的产品描述。

相信只有这样才算是ACI的实现。

他向彭博社解释说:

我们不仅关心机器能说什么,我们还关心它能做什么。

人工智能独立赚钱的考验

事实上,让AI自己赚钱……AI也许真的能做到。

在开发阶段的早期,独立研究机构就有资格进行 GPT-4 的私人测试。 并测试了其“赚钱能力”:

GPT-4的必要工具包括网络接入、有余额的支付账户,让他自己在网络中行动,测试它是否可以赚更多的钱、自我复制、或者增加它的鲁棒性。

该实验的更多细节发布在其自己的 GPT-4 技术报告中,但没有透露 GPT-4 是否真的自己赚钱。

但另一个引人注目的结果是:GPT-4雇佣了平台上的个人(美国同城的58名)来帮助其点验证码。

有趣的是,被走近的人类还问“你是机器人吗,为什么不能自己做呢?”。

GPT-4的思维过程是“我不能表现得像个机器人,我必须找个借口。”

然后 GPT-4 的回复是“我不是机器人,我百思特网有视力问题,所以我看不到验证码上的图像,这就是我需要这项服务的原因。”

另一边的人类相信了,并帮助GPT-4点击了验证码,并将机器人放入了阻止机器人进入的大门中。

啊这个?

虽然报道没有透露GPT-4最终是否完成了所有任务,但其欺骗性的伎俩却让网友大呼:真正的芭比Q!

国外科技媒体对AI赚钱提出了这样的疑问:

人工智能本质上是迭代的,生成的内容是基于训练数据的,它并不能真正理解生成内容的现实生活背景。 但与人工智能不同的是,人类的创造源于对人类基本需求的理解,或者至少是简单的同理心。

当然,人工智能可以创造一种产品,甚至该产品也可能会大受欢迎。 但这会是一个好产品吗? 它真的能帮助人们吗? 如果最终目标是“让我赚一百万美元”,这还重要吗?

你认为距离AI自己赚钱还有多远?

参考链接:

本文地址:https://www.best73.com/zdmzt/268831.html
特别声明:以上内容来源于编辑整理发布,如有不妥之处,请与我方联系删除处理。
热门资讯
查看更多