-
_NEWSDATE: 2024-12-16 | News by: 爱范儿 | 有0人参与评论 | _FONTSIZE: _FONT_SMALL _FONT_MEDIUM _FONT_LARGE
Ilya:我觉得从某种意义上讲,这些是人们应该更多反思的问题。对于你提到的关于应该创造什么样的激励结构的问题,我感觉我没有信心回答这些问题。就像你在谈论创建某种自上而下的结构或政府机制。
我不知道,这也有可能是加密货币。你知道的,有些事情我感觉自己并不是合适的人选来评论加密货币,但,嗯……顺便说一下,你描述的情况是有可能发生的。
确实,我们会有。你知道,从某种意义上说,这并不坏。如果我们有人工智能,而它们所想要的只是与我们共存,并且只是想要权利,也许这就可以了。
提问:你好,谢谢你的精彩讲座。我是来自多伦多大学的 Shelepov Chitz。感谢你所做的一切。我想问一下,你认为 LLMs 是否能够在分布外进行多跳推理的泛化?
Ilya:好吧,这个问题假设了答案是「是」或「不是」。这个问题不应当用「是」或「不是」来回答,因为我们需要弄清楚:什么是分布外的泛化,什么是分布内的,什么又是分布外的?
因为这是一次关于 「时间检验」 的演讲。
我想说,很久很久以前,当人们还没有使用深度学习时,他们使用的东西包括字符串匹配和 n-gram 用于机器翻译,人们使用的是统计短语表。
你能想象他们当时有数万个复杂的编码,这真的是难以想象的。而在那个时候,泛化意味着,它和数据集中的表述字面上不同。
现在,我们可能会说,模型在数学竞赛达到了这个高分。但也许这些数学题在互联网上某个论坛上早被讨论过了,因此它记住了。
好吧,你可以说也许它在分布内,也许是记忆化,但我也认为我们的标准,对于什么算作泛化,已经大大提高了。如果你一直有留意这类发展的话,甚至可以说显着地,不可想象地提高了。
所以,我认为答案是,在某种程度上,模型的泛化能力可能没有人类做得那么好。我认为人类的泛化能力要好得多,但与此同时,他们确实会在某种程度上进行分布外的泛化。我希望这个答案是有用的,尽管它有点重复。
不幸的是,我们的时间到了。我有种感觉,我们可以再聊六个小时,但最后还是非常感谢这次讲座。- 新闻来源于其它媒体,内容不代表本站立场!
-
原文链接
原文链接:
目前还没有人发表评论, 大家都在期待您的高见