虾画怪谈的头像-卡咪卡咪哈-一个博客
管理员
这家伙很懒,什么都没有写...
2023世界人工智能大会“AI生成与垂直大语言模型”论坛重磅来袭!那个高考故意考0分,写8000字抨击高考制度的蒋多多,现在怎样?-卡咪卡咪哈-一个博客

2023世界人工智能大会“AI生成与垂直大语言模型”论坛重磅来袭!那个高考故意考0分,写8000字抨击高考制度的蒋多多,现在怎样?

当前AI生成与大语言模型的指数级发展,为相关产业链带来新的发展引擎,也为AI落地应用带来新的想象空间。7月7日上午,在世界人工智能大会组委会办公室和共青团上海市浦东新区委员会的指导下,上...
1年前
03910
对话360集团CEO创始人周鸿祎:做大语言模型比做光刻机简单多了“肯德基吸管”事件遭群嘲,把当代社会的又一病态现象暴露无遗-卡咪卡咪哈-一个博客

对话360集团CEO创始人周鸿祎:做大语言模型比做光刻机简单多了“肯德基吸管”事件遭群嘲,把当代社会的又一病态现象暴露无遗

本文是5月31日品玩举办的“模型思辨——国内大模型生态研讨会”上,品玩创始人、CEO骆轶航与360集团创始人、CEO周鸿祎的对话实录,经整理编辑发布。访谈人:骆轶航受访人:周鸿祎 大模型确实要...
1年前
0667
【自然语言处理】【大模型】PaLM:基于Pathways的大语言模型-卡咪卡咪哈-一个博客

【自然语言处理】【大模型】PaLM:基于Pathways的大语言模型

《PaLM: Scaling Language Modeling with Pathways》 论文地址:https://arxiv.org/pdf/2204.02311.pdf 一、简介 近些年,超大型神经网络在语言理解和生成的广泛任务上实现了令人惊讶的效果。这...
1年前
0597
参数少量提升,性能指数爆发!谷歌:大语言模型暗藏「神秘技能」-卡咪卡咪哈-一个博客

参数少量提升,性能指数爆发!谷歌:大语言模型暗藏「神秘技能」

编辑:Cris 【新智元导读】谷歌的这项研究,很可能是我们迈向AGI的一大步。 由于可以做一些没训练过的事情,大型语言模型似乎具有某种魔力,也因此成为了媒体和研究员炒作和关注的焦点。 当扩展...
1年前
05112
大型语言模型系列解读(一):大语言模型涌现的新能力-卡咪卡咪哈-一个博客

大型语言模型系列解读(一):大语言模型涌现的新能力

语言模型是根据已知文本生成未知文本的模型。自GPT-3以来,大型语言模型展现出了惊人的zero-shot和few-shot能力,即不改变参数仅改变输入的in-context learning。这是与此前流行的finetune范式...
1年前
05011
DeepMind最新研究:如何将「大语言模型」 训练到最优?-卡咪卡咪哈-一个博客

DeepMind最新研究:如何将「大语言模型」 训练到最优?

作者丨维克多 Transformer的提出距离我们已经有5年的时间,随着模型规模的不断增长,性能提升也逐渐出现边际效益递减的情况。如何训练出最优性能的大模型? 最近,DeepMind做了一项调查,想弄清...
1年前
06812