用微信扫码二维码
分享至好友和朋友圈
出品 | 网易科技《态度》栏目
当全球AI竞赛聚焦于千亿参数堆砌与算力军备战时,却以“技术平权”的姿态撕开了行业裂缝。
其推出的DeepSeek-R1模型不仅将企业级市场的深度推理能力直接赋予C端用户,更将行业长期信奉的“预训练霸权”推向瓦解边缘。
然而在技术祛魅的浪潮下,一些争议也随之涌现:当DeepSeek-R1-Zero通过强习自主生产数据,传统数据标注行业是否面临消亡?高调推出的Grok 3在数学推理测试中“翻车”,是否暴露了AI评测体系的深层缺陷?······
带着这些疑问,网易科技《Future Talk》邀请到了两位专家一起探讨,他们分别是星尘数据CEO章磊、天云数据CEO。(注:由于部分原因,星尘数据产品负责人张毅倜代CEO章磊参与讨论)
星尘数据成立于2017年,是国内首家专注于AI数据自动处理技术的标杆企业。公司以技术创新为核心驱动,自主研发全球首款AI数据全生命周期引擎MorningStar,覆盖数据采集、标注到模型迭代的全链路管理,显著提升企业数据生产效率50%以上,助力解决“数据债”难题。(类似于软件开发过程中的“技术债”,“数据债”是指在的各个环节中,由于低估了数据的重要性,在推进项目的过程中忽视了数据质量的把控,从而欠下的各种“债务”。)
而天云数据是一家国有参股企业,首批国家级专精特新小巨人企业,北京市技术奖厂商。是国内能够同时提供数据基础设施和数字原生全产业服务链的数据科学公司。秉承“数据+智能”的理念致力于大数据(AI-Native 数据库)和软件的研发与创新,赋能产业数智化转型。在数据供给侧和数据消费侧均获得多项权威认可。
DeepSeek搅局者还是革命者?
天云数据CEO雷涛认为,DeepSeek实现了大模型的祛魅,开启了中美后训练时代的大门。
进入后训练阶段,模型更多地承担起将通用世界知识向领域知识转化的重任。以DeepSeek-R1系列为例,它以强化学习为主导,并将长思维链CoT(Chain of Thought)这一原本为等模型厂商的闭源recipe直接开放给community。这一举措,在模型交付层面,将国产和北美大厂的模型推理能力差距瞬间拉平,无疑是对传统市场格局的一次大胆挑战。
星尘数据产品负责人张毅倜进一步补充道:“DeepSeek将数据从量的问题转化成一个质的问题,将会对数据行业产生重大影响。"
数据枯竭之争:真相与出路
随着AI模型朝着高质量方向迅猛发展,不少人断言当下数据已陷入 “枯竭” 困境。对此,张毅倜认为这是一个伪概念。
他解释说,当前所谓枯竭的数据,主要集中在图文类数据。而实际上,大量数据正以多模态或非结构化形式,隐匿于人类日常生活的各个角落。
那么,如何将这些未被充分挖掘的数据转化为高质量数据呢?张毅倜给出了几种途径:其一,由专业团队人工手动生成,这类数据堪称高质量的专家数据;其二,受DeepSeek-R1-Zero启发,通过大规模强化学习训练模型,进而利用该模型生产数据;其三,借助专业的AI数据平台如MorningStar进行训练,在训练过程中挖掘出高质量数据。
雷涛则从另一角度解读数据质量问题,他认为数据质量的高低并非由主观认知简单判定,而是取决于所采用的AI。他表示,如今已有大量数据由AI生成,但这并不意味着这些数据就是 “假数据”。
“所谓高质量与低质量数据,其评价标准与方式,归根结底在于AI算法。” 雷涛进一步阐释,“这就是当下热议的数据概念。AI模型使用的数据由其自身生成,数据飞轮正是构建模型持续迭代生长的关键方法。”
Grok 3:技术秀肌肉还是战略拼图?
在谈及Grok 3时,张毅倜认为它不过是马斯克AI体系中的一次技术溢出。
对于马斯克宣称其模型在数学推理方面优于国内模型,却在 “9.9与9.11哪个大” 这类简单问题上 “翻车” 的现象,张毅倜指出,目前所有模型评测大多基于开源数据集,而这些Benchmark最早由北美主导制定,在计算层面重视程度相对不足。此外,国外通常会制定两套Benchmark,一套面向普惠大众,一套用于推理测试。而推理模型的Benchmark在逻辑上,其实是在其自行公布的数据集测试中超越了OpenAI o1系列大模型。
雷涛则表示,不能仅依据几个Benchmark,便在传统认知赛道中评判模型优劣。我们更应关注多模型之间的通用性。为实现端到端的训练合成数据,如何运用AI手段进行数据生产,已然成为行业发展的必备逻辑。
行业走向:“通用模型+专业服务”还是“行业模型主导”?
雷涛认为,行业内存在大量个性化数据,许多行业知识无法单纯依靠Transformer的排列组合进行推理。
DeepSeek的架构为我们带来启示,我们可以将行业深层领域的知识,通过验证激励机制融入强化学习,从而在大模型层面,而非传统机器学习层面,更有效地获取行业科学知识体系。
他表示:“领域知识的探索之路还很漫长,绝非简单的微调、过滤与蒸馏所能涵盖。”
张毅倜则认为行业模型的概念是模糊的,它没有一个明确的边界,很难去定义。
他表示,未来的模型由Personal Language Model和Lagre Language Model来划分。
而在实际业务场景应用中,专业模型才是未来趋势的主导。
网易科技态度见闻 2025-04-17 21:10:00
林丑丑的慢生快活 2025-04-15 23:24:04
DeepSeek搅局者还是革命者?
天云数据CEO雷涛认为,DeepSeek实现了大模型的祛魅,开启了中美后训练时代的大门。
星尘数据产品负责人张毅倜进一步补充道:“DeepSeek将数据从量的问题转化成一个质的问题,将会对数据行业产生重大影响。"
数据枯竭之争:真相与出路
他解释说,当前所谓枯竭的数据,主要集中在互联网图文类数据。而实际上,大量数据正以多模态或非结构化形式,隐匿于人类日常生活的各个角落。
“所谓高质量与低质量数据,其评价标准与方式,归根结底在于AI算法。” 雷涛进一步阐释,“这就是当下热议的数据概念。AI模型使用的数据由其自身生成,数据飞轮正是构建模型持续迭代生长的关键方法。”
Grok 3:技术秀肌肉还是战略拼图?
在谈及Grok 3时,张毅倜认为它不过是马斯克AI体系中的一次技术溢出。
雷涛则表示,不能仅依据几个Benchmark,便在传统认知赛道中评判模型优劣。我们更应关注多模型之间的通用性。为实现端到端的训练合成数据,如何运用AI手段进行数据生产,已然成为行业发展的必备逻辑。
行业走向:“通用模型+专业服务”还是“行业模型主导”?
DeepSeek的架构为我们带来启示,我们可以将行业深层领域的知识,通过验证激励机制融入强化学习,从而在大模型层面,而非传统机器学习层面,更有效地获取行业科学知识体系。
他表示,未来的模型由Personal Language Model和Lagre Language Model来划分。
而在实际业务场景应用中,专业模型才是未来趋势的主导。
深圳市联软科技股份有限公司,专注于企业级网络安全市场,为政企客户提供网络安全产品和服务,打造了网络准入控制、终端一体化、终端安全管理系统、数据防泄露、数据安全摆渡、政务外网一机两用、网络入侵检测、移动端安全管理、跨网数据安全交换、物联网安全、互联网资产测绘、零信任安全、终端检测与响应等产品的综合安全解决方案。
悬赏蛙的任务类型丰富多样,包括悬赏任务、问卷调查、公众号赚钱、小程序赚钱等,总有一款适合你。在这里,你不但可以接单赚钱,还可以在生活、学习、工作中遇到需要帮助的事情时,在平台发布任务。平台还有红包奖励、签到奖励、接单排行榜、邀请奖励等官方补贴活动。
爱站网百度权重查询(baidurank.aizhan.com)提供最专业的百度流量分析、查询站长工具站
广东潮汇水产有限公司核心团队专注鲜活水产品经营近30年,拥有高效、畅通的复合型销售和配送渠道,以及领先行业的水产综合运营经验,完善与扎实的供应链基础。
世间万物皆可解说,独白提供文案!独白文案网为电影解说和科普类博主提供直白的解说词,主要提供的类型有热播电影、电视剧、动漫、综艺、科普类节目,成为会员即可提供完整的解说词。相比自己创作要降低很多难度,帮助您的节目更快捷上线。
上海办公室设计装修装潢优选领企办公室设计公司,领企上海办公室装修设计公司排名前列,集写字楼装修、办公楼装修、办公楼设计、厂房装修、办公室装饰设计施工于一体,真实上海办公室装修案例,上海办公室装修公司电话:400-992-1887
杭州一束创意设计是一家拥有丰富品牌建设、传播与营销实战输出经验的品牌视觉设计公司,由中国美术学院硕士教学研究室优秀设计团队与多位资深行业从业者合力筹建…
京东物流,省心高效_京东物流是中国领先的技术驱动的供应链解决方案及物流服务商,以“技术驱动,引领全球高效流通和可持续发展”为使命,致力于成为全球最值得信赖的供应链基础设施服务商。京东物流向您提供仓配服务、快递快运服务、大件服务、冷链服务、跨境服务。客服专线950616,7*14小时服务。
夏普邹海明:4G带来C端变革,5G将带来B端变革,夏普,邹海明,富士康,华为,郭台铭
专访文福拴教授:现在充电桩建设速度落后于电动汽车销量,充电桩,电动汽车,充电站,新能源汽车,车桩,汽车
脉脉CEO林凡:别误会,我们不是大厂的敌人,林凡,潮头,马云
“刘畊宏女孩”刷屏背后的终极推手,刘耕宏,潮头,周杰伦,抖音
格灵深瞳CEO赵勇:上市不是终点,懈怠是我最担心的事情|潮头,赵勇,格灵,深瞳,潮头,人工智能,沈南鹏
那些被贾跃亭"坑过"的人们,贾跃亭,乐视,孙宏斌,许家印,恒大集团,乐视体育
量子竞逐:谁将主导新科技时代?,量子计算,潘建伟,量子计算机,卫星,量子
易评机:虽为小改款升级,三星折叠屏新机依旧很稳,三星,三星galaxy,三星手机,z系列
追觅Z10Station体验:剑指戴森智能集尘90天不用倒,戴森,吸尘器,集尘,滤网,吸力,除螨
OpenAI奥特曼罕见长文发声:几千天后“超级智能”将至没有人会怀念过去,超级智能,怀念过去,openai,奥特曼,人工智能,ai
连夜包机!苹果急运600吨印度产iphone回美,工厂周日加班生产,iphone,苹果,apple,富士康,工厂,特朗普
市场监管总局:将全力整治直播电商乱象,直播,网售,电商乱象,市场秩序,市场监管总局
专访小冰CEO李笛:小冰从不追风口,也无需证明自己,李笛,微软,人工智能,沈向洋,微软小冰
智见丨专访印奇:中国AI已经很争气了未来12个月非常关键,印奇,12个月,ai,旷视
潮头|烈儿宝贝:当所有人努力奔跑时,我不想跌倒,潮头,直播,直播间,李佳琦,烈儿
一图看懂WWDC23售价2.5万苹果VisionPro头显终于来了,WWDC23,苹果
小米手环8Pro上手:更轻更薄兼顾智能手表体验,智能手表,手环,小米,可穿戴设备,手机,腕带
本文地址:https://www.68zk.com/hlwzxwz/168.html
上一篇:英伟达最新财报回击DeepSeek焦虑态度deepse...
下一篇:DeepSeek之后,阶跃星辰要用生态突围deepseek...