用微信扫码二维码
分享至好友和朋友圈
出品 | 网易科技《》栏目
一场关于的讨论,正在两个世界里以截然不同的方式展开。
在AI圈,它几乎没引起任何波澜。
对他们而言,Transformer是一种常识级的存在,几乎像空气一样不言自明。他们认为:Transformer不仅是一项技术,更是一个生态。大家都在用,也早已与最初的模样不同,根本不可能动真格发动专利战。
当前部分使用Transformer架构的,DeepSeek整理,网易科技制图
但在另一个空间——律师圈,气氛却截然不同。
知名律所的专利律师正在朋友圈和会议室中频繁提及“注意力机制”“代理授权”“中国驳回”这些关键词。
有人在推演一旦专利通过后,哪些公司会被波及;有人开始查阅中、美、欧专利数据库,一页页比对的申请文本;还有律师干脆直接到大模型公司登门拜访,告诉他们是时候注意到这件事情了。
一位律师感慨:“你们搞AI的啊,真是太乐观了。谷歌要是真开始收专利费,你们才知道什么叫全球化风险。”
于是,一个“毫无反应”的技术世界和一个“高度活跃”的法律世界,在谷歌Transformer专利复审这件事上,对着同一件事,双方没有对话,做出完全不同的判断。
但也正是这种割裂,在提醒着我们:
AI 的竞争绝不只是数据、算力与的竞速,更是关于规则制定、权利边界与商业博弈的复合战争。
谷歌的专利保护范围,针对“注意力机制”
在 AI 圈,Transformer 是常识,是已经嵌入无数大模型底层结构的“地基”。
它由谷歌研究团队于2017年,在论文《Attention Is All You Need》中提出,目前已成为大语言模型(如 、BERT、Llama)的基石。
截至2025年3月,《Attention Is All You Need》论文已被引用超17万次,是 AI 领域最具影响力的研究之一。
该论文引入了自注意力机制和多头注意力机制,注意力机制让模型能在处理语言序列时,自主判断哪些词更重要,从而显著提高了效率与表达能力。谷歌围绕这一机制,已在全球布局了数十项同族专利,并在美国、欧洲、日本等地陆续获批。
谷歌Transformer发明专利全球布局概况
但在国内律师圈,它却仍是一个悬而未决的法律议题。
值得注意的是,
谷歌Transformer发明专利并非针对整个Transformer架构,而是针对其核心底层机制,也就是我们通常所讲的“注意力机制”。
2024年1月,中国以“不属于专利法规定的技术方案”为由,驳回了谷歌的专利申请。
驳回决定指出,
该专利主要涉及对神经网络算法的改进,未能解决具体技术领域的具体技术问题,未能采用专利法意义上的技术手段,也未能实现专利法意义上的技术效果。
听上去术语复杂,其实问题出在两个核心点:一是这项发明只是对神经网络算法的改进,并未解决某个具体的工程或技术问题;二是注意力机制是算法内部的计算逻辑,不属于被中国专利法承认的“技术手段”。
随后,谷歌主动调整。2024年4月,谷歌将专利限缩到“摘要”和“问答”两个应用场景,并向中国国家知识产权局提交复审请求。同年11月14日,国家知识产权局撤销此前驳回决定,专利进入实质性审查。
换句话说,谷歌不再主张整个注意力机制都属于自己,而是希望先在部分高频应用上取得突破。
这也意味着,
一旦大模型在“摘要”和“问答”两个应用场景中应用“注意力机制”,就很难逃脱谷歌的专利保护范围。
图注:谷歌Transformer中国发明专利的最新修改文本
但此后,新一轮的博弈又开始了。
图注:《国家知识产权局的第四次审查意见通知书》
但北京高文律所、专利律师王冬告诉网易科技,
无论删除权利要求还是据理力争,说明书公开不充分的问题不难克服。也就是说,这件中国专利未来授权概率很高。
如果这些同族专利最终获得授权,将有助于谷歌在 AI 时代构建全球技术壁垒,让Transformer变成企业必须“付费通行”的高速公路。
一旦谷歌主张专利侵权,企业或陷入“三选一”困局
一旦专利获得授权,问题就不再是“能不能用”,而可能是“怎么用”。
发明专利是专利体系中保护力度最强的,最长可达20年。此次我们所讨论的谷歌 Transformer 架构的专利,就属于发明专利范畴。
获得专利授权后,持有者可以通过许可、转让或诉讼实现商业收益,并对侵权者要求停止侵害,并赔偿损失。
当然,专利侵权的确认和范畴还需要复杂的界定。但一旦确认侵权,依赖该架构的企业,则或将面临三种选择:
· 继续使用但支付专利许可费;
· 另寻模型架构,规避技术壁垒。
对于巨头公司来说,支付授权费或许只是成本问题。但对技术路径已经依赖Transformer架构、资金资源有限的中小企业而言,这几乎等于一纸封路令。
更隐秘的风险在于:
如果谷歌的专利保护范围足够宽泛,即使后来者对架构进行了优化和改良,也依然可能落入其权利要求的“覆盖区”,
但拥有专利,不等于主动开战。
行业人士向网易科技表示,
专利更多时候是一个防守型武器。它真正的价值,在于确立优先权——当有人对你发起专利诉讼,你可以用自家的专利组合进行反制。这也是为什么科技巨头普遍选择通过交叉授权来达成一种“核威慑”式的平衡。
谷歌过去在 AI 领域的专利布局,也更像是在修一座“技术护城河”。
它要的是位置,是议价权,而不是立即变现的通行费。
这背后还有现实考量:专利诉讼周期长、成本高、结果不确定。
涉谷歌的部分专利纠纷案件及结果,DeepSeek整理,网易科技制图
综上,
谷歌主动对AI大模型公司发起专利诉讼的可能性极低。但这并不意味着它不会发生。
王冬律师指出,这就像达摩克里斯之剑——
Transformer并非唯一,大模型架构探索仍在继续
尽管谷歌专利引发了行业高度关注,但从技术演进的角度看,Transformer 可能并非不可替代的唯一选项。
元始智能联合创始人、COO罗璇向网易科技透露,虽然Transformer 仍是当前主流架构,但行业内已有迹象表明,头部 AI 公司和研究机构已经正在探索“非 Transformer ”架构的替代方案。
罗璇表示,
这不仅仅是一个国产化替代的问题,更是企业在面对 Transformer 架构能力瓶颈、算力资源紧张背景下,为追求更高效率和更强性能所做的主动技术突围。
腾讯混元 T1就引入了 Hybrid-Mamba-Transformer 融合架构,通过结构调整大幅降低计算复杂度,并优化 KV-Cache 的内存占用,提升推理和训练效率。
英伟达也在其开源大模型 Nemotron-H 中使用了类似的混合架构,推理速度达到同体量竞品的三倍,显著提高了在实际部署中的能效比。
而在部署层面,则更进一步:已在 Windows 系统中默认内置 RWKV 模型调用库。罗璇告诉网易科技,RWKV 作为一种非 Transformer 架构,已经成为当前部署最广泛的非transformer架构。
部分非Transformer架构的模型,DeepSeek整理,网易科技制图
在这些架构探索和专利博弈的背后,反映出的其实是一个更深层的行业逻辑:
AI 竞争的战场,从来不仅是技术优劣的单点比拼,更是围绕技术生态和制度规则的全局较量。
谁拥有更高的效率、更强的通用性,当然能在模型性能上占据先机;但谁掌握标准、协议的制定权,才能在全球范围内确立自己的主导地位。
对国内 AI 企业而言,
大模型不仅仅是技术课题,更是建立商业护城河、构建国际竞争力的核心资产。
谷歌的 Transformer 专利最终是否会成为 AI 产业的“紧箍咒”,尚未可知。但可以肯定的是:未来 AI 的竞争,早已不止是架构之争,也不止是参数规模的军备竞赛。
更激烈的较量,正在算法之外悄然展开。
工信部电子知识产权中心 2025-04-18 17:40:37
但在另一个空间——律师圈,气氛却截然不同。
AI 的竞争绝不只是数据、算力与算法的竞速,更是关于规则制定、权利边界与商业博弈的复合战争。
谷歌的专利保护范围,针对“注意力机制”
它由谷歌研究团队于2017年,在论文《Attention Is All You Need》中提出,目前已成为大语言模型(如 GPT、BERT、Llama)的基石。
但在国内律师圈,它却仍是一个悬而未决的法律议题。
谷歌Transformer发明专利并非针对整个Transformer架构,而是针对其核心底层机制,也就是我们通常所讲的“注意力机制”。
该专利主要涉及对神经网络算法的改进,未能解决具体技术领域的具体技术问题,未能采用专利法意义上的技术手段,也未能实现专利法意义上的技术效果。
一旦大模型在“摘要”和“问答”两个应用场景中应用“注意力机制”,就很难逃脱谷歌的专利保护范围。
无论删除权利要求还是据理力争,说明书公开不充分的问题不难克服。也就是说,这件中国专利未来授权概率很高。
一旦谷歌主张专利侵权,企业或陷入“三选一”困局
当然,专利侵权的确认和范畴还需要复杂的界定。但一旦确认侵权,依赖该架构的企业,则或将面临三种选择:
如果谷歌的专利保护范围足够宽泛,即使后来者对架构进行了优化和改良,也依然可能落入其权利要求的“覆盖区”,
但拥有专利,不等于主动开战。
专利更多时候是一个防守型武器。它真正的价值,在于确立优先权——当有人对你发起专利诉讼,你可以用自家的专利组合进行反制。这也是为什么科技巨头普遍选择通过交叉授权来达成一种“核威慑”式的平衡。
它要的是位置,是议价权,而不是立即变现的通行费。
这背后还有现实考量:专利诉讼周期长、成本高、结果不确定。
更关键的是,如果谷歌今天挥舞专利大棒,明天就可能面对整个行业的联合反弹。
谷歌主动对AI大模型公司发起专利诉讼的可能性极低。但这并不意味着它不会发生。
王冬律师指出,这就像达摩克里斯之剑——
Transformer并非唯一,大模型架构探索仍在继续
这不仅仅是一个国产化替代的问题,更是企业在面对 Transformer 架构能力瓶颈、算力资源紧张背景下,为追求更高效率和更强性能所做的主动技术突围。
AI 竞争的战场,从来不仅是技术优劣的单点比拼,更是围绕技术生态和制度规则的全局较量。
大模型不仅仅是技术课题,更是建立商业护城河、构建国际竞争力的核心资产。
华信会计师事务所
珠三角领先的城市综合运营商
溧阳新彤保温材料厂主营各种保温材料,包括岩棉管、岩棉板、石棉绳、硅酸铝制品、离心玻璃棉制品、橡塑管、橡塑板、聚氨酯制品、树脂等;以及外用保温材料,包括铁皮、镀锌铁皮、彩钢皮、铝板、不锈钢、普通铝箔、镜面铝箔、玻纤布和铝箔玻纤布。价格实惠,物美价廉。
广东纺织职业技术学院是经广东省人民政府批准、国家教育部备案的一所省属全日制普通高等学校,是广东省唯一的纺织服装类综合院校,是全省纺织服装行业人才培养的重要基地。学院位于广东省佛山市高明区富湾镇西江新城,校园秀丽雅致,环境优美。学院现设有8系2部,即纺织系、服装系、经济管理系、轻化工程系、艺术设计系、机
福州中阀厦洋阀门制造有限公司生产的产品有城市煤气快速启闭闸阀、中、低压闸阀,止回阀、截止阀、快开排泥阀、旋塞阀、过滤器、全喷塑软密封闸阀、蝶阀等
奇精机械股份有限公司是一家具有持续创新能力的多元化智能制造企业,现已形成家电零部件、汽车零部件及电动工具零部件三大业务的产业格局。总部位于浙江宁波,并在宁波宁海、合肥、上海、泰国等地设立多家子公司...
思博网-中国知识产权垂直领域人才培养领航者,2009年创办,汇集了超过50万知识产权行业专业人才汇聚思博网络平台。也是全国专利代理人资格考试、知识产权师考试、专利代理人工程师考试专业辅导机构,为超3000家企业及机构提供知识产权人才招聘等服务,是行业细分领域知名品牌。
海口广联达商城是专业电脑配件批发网,全国闪电发货支持担保交易并且售后包售,我们提供完美的售后服务,海口广联达(海口广联达科技)商城是电脑配件进货渠道的首选!服务热线:18976869321
独家专访九天微星创始人谢涛:做卫星界的华为,谢涛,卫星,微星,九天,马斯克,卫星界
吕子平:卫星互联网永远是地面互联网的延伸和补充,卫星,吕子平,互联网,高轨,卫星通信,通信
创新工场合伙人郎春晖:投后管理成为VC应对变化的第一道防线,郎春晖,合伙人,创投,风投,创新工场,创业者
锤子生死劫:深陷资金链紧张、大规模裁员困局,锤子
三大关键词看懂2023年智能小家电发展趋势,家电,小家电,智能小家电,厨房家电
王江舟院士谈5G:中国的设备领先,美国在芯片称霸,王江舟,美国,院士,英国,工程院
狼来了!理想汽车不再是一家车企李想官宣做基座模型,造硅基家人,汽车,人工智能,机器人,理想,基座,自动驾驶
连夜研究,美股震荡,DeepSeek到底干了什么?,英伟达,人工智能,deepseek,硅谷,openai,芯片
盒马X会员店大撤退:新零售的“断臂求生”,会员店,零售,山姆,超市,会员制,costco
4月17日外媒科学网站摘要:实验室“种”出整块鸡肉,粒子,ips细胞,电荷,实验,神经元
淘宝海外爆红,全球购物车少不了“中国货”,淘宝,美国,关税,中国货,电商平台
从来就不按什么好人坏人的分类,认定的事情认死理一般的去做,是我太傻还是现实有点乱?这几天迷上了看书,不再喜欢浏览网上的新闻,不再去考虑那些纷繁的回忆,不再为了朋友的一句话而烦恼...
脉脉CEO林凡:别误会,我们不是大厂的敌人,林凡,潮头,马云
成王败寇:在线教育血拼100天,在线教育,作业帮,学而思网校,好未来,学而思,张邦鑫
海外疫情下,我为什么不回国?,王磊,周然,郝云,口罩,李天
大疆OsmoPocket3体验:手持云台相机中的「绝对顶流」,pocket,手机,云台,大疆,相机,OsmoPocket3
本文地址:https://www.68zk.com/hlwzxwz/188.html
上一篇:ChatGPT新增记忆技能你的聊天记录它都记得...
下一篇:对话七维科技CEO殷元江AI加速XR虚拟制作周...