最新头条|a看片在线婷_社会新闻

首页 >新闻 >社会新闻

鲸起生万物：有关DeepSeek的2期硬核播客总结

2025-02-14 10:55:01

来源：

猫眼影戏

作者：

曹勇

手机检察

　　猫眼影戏记者纪良才报道P6F9A2Y5R3B1T0V4X8W

文 | 阑夕 DeepSeek火出圈的这十几天，其实也是噪音最多的一段时间，说实话大部分的讨论制品都有种加班硬赶KPI的味道，是人是鬼都在掰扯，有留存价值的屈指可数，倒是有两期播客让我听后受益匪浅，很是推荐。一个是张小珺请来加州伯克利大学AI实验室博士潘家怡对DeepSeek论文的逐句讲解，接近3个小时的高密度输出，很是能杀脑细胞，但杀完之后排泄出来的内啡肽，也含量爆炸。另一个是Ben Thompson关于DeepSeek的3集播客合集，加起来1个多小时，这哥们是News Letter的开创者，也是全球最懂技术的剖析师之一，终年旅居台北，对中国/亚洲的近距离洞察比美国同行要高许多。先嗣魅张小珺的那期，嘉宾潘家怡其时是在读完DeepSeek的论文之后，最快开发出了小规模复现R1-Zero模型的项目，在GitHub上已经接近1万Stars。这种薪火相传式的知识接力，其实是技术领域理想主义的投射，就像月之暗面的研究员Flood Sung也说，Kimi的推理模型k1.5最初就是基于OpenAI放出来的两个视频获得了启发，更早一点，当Google宣布「Attention Is All You Need」之后，OpenAI立刻就意识到了Transformer的未来，智慧的流动性才是一切进步的先决条件。所以各人才对Anthropic首创人Dario Amodei那番「科学没有国界，但科学家有祖国」的封闭亮相大为失望，他在否定竞争的同时，也在挑战基本知识。继续回到播客内容上，我照旧试着划些重点出来给你们看，推荐有时间的照旧听完原版： - OpenAI o1在惊艳登场的同时做了很是深厚的隐藏事情，不希望被其他厂商破解原理，但从局势上有点像是在给行业提了一个谜语，赌的是在座列位没那么快解出来，DeepSeek-R1是第一个找出谜底的，并且找谜底的历程相当漂亮； - 开源能够比闭源提供更多简直定性，这对人力的增长和结果的产出都是很有资助的，R1相当于把整个技术路线都明示了出来，所以它在引发科研投入上的的孝敬要胜过藏招的o1； - 尽管AI工业的烧钱规模越来越大，但事实上就是我们已经有接近2年时间没有获得下一代模型了，主流模型还在对齐GPT-4，这在一个主张「日新月异」的市场里是很稀有的，即便不去追究Scaling Laws有没有撞墙，OpenAI o1自己也是一次新的技术线实验，用语言模型的方法让AI学会思考； - o1在基准测试里重新实现了智力水平的线形提升，这很牛逼，发的技术报告里没有披露太多细节，但要害的地方都讲到了，好比强化学习的价值，预训练和监督微调相当于是给模型提供正确谜底用来模仿，久而久之模型就学会依葫芦画瓢了，但强化学习是让模型自己去完成任务，你只告诉它结果是比照旧差池，如果对就多这么干，如果差池就少这么干； - OpenAI发明强化学习可以让模型爆发接近人类思考的效果，也就是CoT（思维链），它会在解题办法蜕化时回到上一步实验想些新步伐，这些都不是人类研究员教出来的，而是模型自己为了完成任务被逼，哦不，是涌现出来的能力，厥后当DeepSeek-R1也复现出了类似的「顿悟时刻」，o1的焦点堡垒也就被实锤攻破了； - 推理模型实质上是一个经济盘算的产品，如果强行堆砌算力，可能到了GPT-6仍然可以硬怼出类似o1的效果，但那就不是大力出奇迹了，而是奇迹出奇迹，可以但没须要，模型能力可以理解为逊с力x推理算力，前者已经太贵了，后者还很自制，但乘数效应是差未几相等的，所以现在行业都开始扎走搞性价比更优的推理路线； - 上个月末o3-mini的宣布和DeepSeek-R1可能关系不大，但o3-mini的订价降到了o1-mini的1/3，肯定是受到了很大的影响，OpenAI内部认为ChatGPT的商业模式是有护城河的，但卖API没有，可替代性太强了，海内最近也有关于ChatBot是不是一门好生意的争议，甚至DeepSeek很明显都没有太想明白怎么承接这波泼天流量，做消费级市场和做前沿研究可能是有天然冲突的； - 在技术专家看来，DeepSeek-R1-Zero要比R1越发漂亮，因为人工干预的身分更低，纯粹是模型自己摸索出了在推理几千步里寻找到最优解的流程，对先验知识的依赖没那么高，但因为没有做对齐处理，R1-Zero基本上没法交付给用户使用，好比它会种种语言夹杂着输出，所以实际上DeepSeek在公共市场获得认同的R1，照旧用了蒸馏、微调甚至预先植入思维链这些旧手段； - 这里涉及到一个能力和体现并差别步的问题，能力最好的模型未必是体现最好的，反之亦然，R1体现精彩很洪流平上照旧因为人工使劲的偏向到位，在训练语料上R1没有独吞的，各人的语料库里都会包括古典诗词那些，不保存R1明白更多，真正的原因可能在于数据标注这块，据说DeepSeek找了北大中文系的学生来做标注，这会显著提高文采表达的奖励函数，一般行业里不会太喜欢用文科生，包括梁文锋自己有时也会做标注的说法不可是说明他的热情，而是标注工程早就到了需要专业做题家去领导AI的田地，OpenAI也是付100-200美金的时薪去请博士生为o1做标注； - 数据、算力、算法是大模型行业的三个飞轮，这一波的主要突破来自算法，DeepSeek-R1发明了一个误区，就是古板算法里关于价值函数的重视可能是陷阱，价值函数倾向于对推理历程的每一步去做判断，由此事无巨细的把模型向正确的门路上引导，好比模型在解答1+1即是几的时候，当它爆发1+1=3的幻觉了，就开始处分它，有点像电击疗法，不许它出错； - 这种算法理论上没毛病，但也很是完美主义，不是每道题目都是1+1这样简单的，尤其是在长思维链里动辄推理几千个Token序列的情况下，要对每一步都进行监督，投入产出比会变得很是低，所以DeepSeek做出了一个违背祖训的决定，不再用价值函数去满足研究时的强迫症，只对谜底进行打分，让模型自己去解决怎么用正确的办法获得谜底，即便它保存1+1=3的解题思路，也不去太过纠正，它反而会在推理历程里意识到差池劲，发明这么算下去得不出正确谜底，然后做出自我纠正； - 算法是DeepSeek之于整个行业的最大立异，包括要怎么区分模型是在模模仿旧推理，我记得o1出来后有许多人声称通过提示词让通用模型也能输出思维链，但那些模型都没有推理能力，实际上就是模仿，它照旧凭据通例模式给出了谜底，可是因为要满足用户要求，又回过头基于谜底给出思路，这就是模仿，是先射箭后画靶的无意义行动，而DeepSeek在对抗模型破解奖励方面也做了许多努力，主要就是针对模型变得鸡贼的问题，它逐渐猜到怎么思考会获得奖励，却没有真的理解为什么要这么思考； - 这几年来行业里一直在期待模型降生涌现行为，以前会觉得知识量足够多了，模型就能自然演化出智慧，但o1之后发明推理似乎才是最要害的那块跳板，DeepSeek就在论文里强调了R1-Zero有哪些行为是自主涌现而非人为命令的，像是当它意识到生成更多的Token才华思考得越发完善、并最终提高自己的性能时，它就开始主动的把思维链越变越长，这在人类世界是本能——长考虽然比快棋更有战略——但让模型自个得出这样的经验，很是让人惊喜； - DeepSeek-R1的训练本钱可能在10万-100万美金之间，比起V3的600万美金更少，加上开源之后DeepSeek还演示了用R1去蒸馏其他模型的结果，以及蒸馏之后还能继续强化学习，可以说开源社区关于DeepSeek的拥戴不是没有理由的，它把通往AGI的门票从奢侈品酿成了快消品，让更多的人可以进来实验了； - Kimi k1.5是和DeepSeek-R1同时宣布的，但因为没有开源，加上国际上积累缺乏，所以虽然也孝敬了类似的算法立异，影响力却相当有限，再就是Kimi因为受到2C业务的影响，会比较突出用短思维链实现接近长思维链的要领，所以它会奖励k1.5用更短的推理，这个初志虽然是迎适用户——不想让人在提问后等太久——但似乎有些事与愿违的回报，DeepSeek-R1的许多出圈素材都是思维链里的亮点被用户发明并流传，关于头一次接触推理模型的人来说，他们似乎并不介意模型的冗长效率； - 数据标注是全行业都在藏的一个点，但这也执偾一项过渡计划，像是R1-Zero那种自学习的路线图才是理想，目前来看OpenAI的护城河照旧很深，上个月它的Web流量抵达了有史以来的最高值，DeepSeek的火爆客观上会为全行业拉新，但Meta会比较难受，LLaMa 3实际没有架构层的立异，也完全没有预料到DeepSeek对开源市场的攻击，Meta的人才储备很是强大，但组织架构没有把这些资源转化成技术结果。再说Ben Thompson的播客，他在许多地方交叉验证了潘家怡的判断，好比R1-Zero在RLHF里去掉了HF（人类反。┑募际趿恋，但更多的论述则是放在了地缘竞争和大厂往事，叙事的观赏性很是流畅： - 硅谷太过重视AI宁静的动机之一在于可以借此把关闭行为合理化，早在GPT-2的协议里就以制止大语言模型被利用拿去生成「欺骗性、带偏见」的内容，但「欺骗性、带偏见」远未抵达人类灭绝级别的危害，这实质上是文化战争的延续，并且基于一个「仓廪实而知礼节」的假设上，即美国的科技公司在技术上拥有绝对的优势，所以我们才有资格分神去讨论AI有没有种族歧视； - 就像OpenAI决定隐藏o1思维链时说得义正辞严——原始思维链可能保存没有对齐的现象，用户看到后可能会感受到被冒犯，所以我们决定一刀切，就不给用户展示了——但DeepSeek-R1一举证伪了上面的迷之自信，是的，在AI行业，硅谷并没有那么稳固的领先职位，是的，袒露的思维链可以成为用户体验的一部分，让人看了之后越发信任模型的思考能力； - Reddit的前CEO认为把DeepSeek描述为斯普特尼克时刻——苏联先于美国发射第一颗人造卫星——是一个强行付与的政治化解读，他更确定DeepSeek位于2004年的Google时刻，在那一年，Google在招股书里向全世界展示了漫衍式算法是如何把盘算机网络连接在一起，并实现了价格和性能的最优解，这和其时所有的科技公司都纷歧样，它们只是购置越来越贵的主机，并宁愿身处本钱曲线最腾贵的前端； - DeepSeek开源R1模型并透明的解释了它是怎么做到这一点的，这是一个巨大的善意，若是凭据继续煽动地悦魅政治的路数，中国公司原来应该对自己的结果保密的，Google时刻也确实为Sun这样的专业效劳器制造商划定了终点线，推动竞争移动到商品层； - OpenAI的研究员roon认为DeepSeek为了克服H800芯片所作出的降级优化——工程师用不了英伟达的CUDA，只能选择更低端的PTX——是过失的示范，因为这意味着他们浪费在这上面的时间无法弥补，而美国的工程师可以毫无记挂的申请H100，削弱硬件无法带来真正的立异； - 如果2004年的Google听取了roon的建议，不去「浪费」名贵的研究人员构建更经济性的数据中心，那么也许美国的互联网公司今天都在租用阿里巴巴的云效劳器，在财产涌入的这二十年里，硅谷已经失去了优化基础设施的原动力，大厂小厂也都习惯了资本密集型的生产模式，乐于提交预算表格去换取投资，甚至把英伟达的芯片干成了典质物，至于如何在有限的资源里尽可能多的交付价值，没人在乎； - AI公司虽然会支持杰文斯悖论，也就是更自制的盘算创立更大宗的使用，但已往几年里的实际行为却是出心口纷歧的，因为每家公司都在体现出研究大于本钱的偏好，直到DeepSeek把杰文斯悖论真正带到了各人的眼皮底下； - 英伟达的公司变得更有价值，和英伟达的股价变得更有危害，这是可以同时保存时生长，如果DeepSeek能在高度受限的芯片上抵达如此成绩，那么想象一下，如果当他们获得全功率的算力资源后，技术进步会有多大，这对整个行业都是激励性的启示，但英伟达的股价建立在它是唯一供应方这个假设上，这可能会被证伪； - 中国和美国的科技公司在AI商品的价值判断上泛起了显性不同，中国这边认为差别化在于实现更优越的本钱结构，这和它在其他工业的结果是一脉相承的，美国这边相信差别化来自产品自己以及基于这种差别化创立的更高利润率，但美国需要反思通过否定立异——好比限制中国公司取得AI研究所需的芯片——来赢得竞争的心态； - Claude在旧金山的口碑再怎么好，也很难改变它在销售API这种模式上的天然弱点，那就是太容易被替换掉了，而ChatGPT让OpenAI作为一家消费科技公司拥有更大的抗危害能力，不过从久远来看，DeepSeek会让卖AI的和用AI的都有受益，我们应该谢谢这份丰富的礼物。嗯，差未几就是这些，希望这篇作业可以帮你们更好的理解DeepSeek出圈之后对AI行业爆发的真实意义。

??时事1：在线观看无码电影

??02月14日,湖南先进制造业应用场景对接会4月28至29日在长沙举办,

　　小不点并没有继续捉，而是跃上了岸，碧蓝的大湖滋养出这种稀珍的鱼类不易，不可捕尽鱼王，还要它们产卵呢。

,国产精品亚洲图片欧美。

??02月14日,中国单体转体最大吨位双索面预应力混凝土斜拉桥完成“转身”,

　　石村，柳树寂静无声，那根嫩枝散发出柔和的光晕，将整个村子笼罩了，兽潮奔腾，但却远远的避开了这里。

,在线看黄AV免费看,一百款黄色软件app,中国无码一α级刺激片。

??时事2：泡芙社区app下载进入ios

??02月14日,宁夏新能源汽车保有量高速增长已突破5万辆,

　　“这是哪个家族的子弟呀，怎么教育的，难道是放在老林子中养大的？”

,多久没做了叫出来,草莓视频在线观看网站的入口免费,午夜看片窝窝。

??02月14日,“行在乡村游在路上”最美自驾精品路线主题推选活动在陕西留坝启动,

　　然而，一切都晚了，仅一瞬间，天空中那粗大的飞蛟就已双目无神，熠熠生辉的鳞片像是经历了万年那么久远，开始倾圯，整具躯体迅速老化，最后四分五裂，坠落了下来。

,悠悠导航app下载播放,97资源站总站在线观看,将冰葡萄放在小洞里第四世。

??时事3：久久综合久久毛片

??02月14日,墨西哥要求美国配合调查军用武器走私问题,

　　同志们，新形势、新任务给党委办公室事情带来了新的挑战，也为各人提供了越发辽阔的生长空间。希望你们以一种为党的事业尽职尽责、勇挑重担的政治责任感，一种为全区三个文明建设开拓进取、多作孝敬的历史使命感，一种抓住机缘、只争朝夕的时代紧迫感，开拓立异，扎实事情，努力开创全区党委办公室事情的新局面，为实现“五年总量翻番，八年全面小康”斗争目标做出更大的孝敬。

,国产精品秘 a级入口,俄罗斯av女星最漂亮排名,爽⋯好舒服⋯快⋯高潮了。

??02月14日,让“创新花”结出“发展果”（现场评论）,

　　“我早就吃肉了，只是偶尔拿它当水喝！”小不点气呼呼，皱着鼻子，瞪着黑宝石般的大眼进行辩白。

,云缨用枪×自己b,天天视频在线观看综合,色一吧色色99一区。

??时事4：马蚤货怎么欠干

??02月14日,2024数字科技生态大会在广州开幕,

　　今天，举行我镇第八届村两委换届选举后主持日常事情村干、计生专干的培训班，其意有三：一是两委换届后事情头绪多，日常事情量大，为了确保培训内容、质量，需要一段时间精心准备;二是少数村换届选举后有一个从波动到稳定的历程，需要适当的时间来检测;三是“双十”寄希望于全体村主持日常事情的村干、计生专干、在本届任期内要十分之意为民效劳，十分之力勤勉事情，为第八届村两委的各项事情开好局、起了步而努力事情，奋力推进镇新农村建设和小康社会进程。第八届村党组织、村民委员会换届选举事情历时两个月，在座的同志们又经历了一次党组织的考验和选民的选择，这是下层民主政治制度在各村又一次生动实践，除因任职年龄等因素主动退出来一些同志外，大部分同志都为连选连任，部分同志是新中选的新人。无论是连选连任照旧新中选，都是党内外选民的现实选择，都是一定和偶然的结合，希望同志们尊重一定，珍惜偶然，以今天的培训班为新起点、新征程、新境界。接过第七届村两委的“接力棒”，肩负起建设“四个”(生态、人文、和谐、魅力)和立异村级社会治理的责任，探索切合村情的“一村一品”、“多元生长”的新花样，开创出谋生长、求和谐、创特色、增收入的新路子，挡担起走在全县生长前列的责任和使命，承载起全镇各级党组织、宽大和万人民的希望和重托，为完成“”计划雄伟目标，描绘村级平台壮美画卷，为建设一个“生态情况好、经济生长快、幸福指数高的十一个美丽乡村而团结斗争!

,处女被操视频免费在线,欧美肏屄视频免费,毛片最新网页。

??02月14日,活力中国丨小县城里的大生意出口海外62个国家新年伊始开足马力赶订单,

　　第三，加速城镇化进程，是建设社会主义新农村的助推器。xx届五中全会提出了建设社会主义新农村的重要历史任务。我县是农业大县，要实现建设社会主义新农村的目标，难点、重点和要害点都在“农”字上。基础出路在于加速推进城镇化建设，通过城镇化“化”农业、“化”农民，把大宗农村人口变为城镇居民，不绝提高农业劳动生产率，为农村经济集约式生长提供辽阔的空间。同时，城镇建设与人民群众的生活息息相关。加速城镇化进程，不但能增进物质文明的快速生长，还能引发人们对教育、医疗卫生、文化艺术等更高条理生长的需求，增进精神文明的生长和公共效劳设施改善。我们只有加速推进城镇化，不绝完善城镇基础设施，才华为新农村的建设打下良好的事情基础。

,澳洲黄色无码视频网站,永久939w75w75乳液,丰满少妇一区二区视频。

【科学家揭示生物在史上最大灭绝事件中形态演变过程】

【客家祖地福建连城二月二“闹春龙” 200米长龙祈丰年】

责编：陈莹

审核：庞涓

责编：柳明

尊龙人生就是博

鲸起生万物：有关DeepSeek的2期硬核播客总结