0
本文作者: nebula | 2025-02-07 14:05 |
春节期间,DeepSeek 一跃成为全球瞩目的焦点。它以仅约十分之一的超低训练成本,成功推出了性能与OpenAI o1近乎相当的开源模型,对全球科技领域带来巨大冲击,先后引发美国科技股的大幅下跌,以及硅谷科技巨头和各国政要的纷纷回应,如今全球各大芯片厂商和智算云服务厂商更是积极响应、跟进适配。半个月来,DeepSeek相关话题热度居高不下,热搜频频,已成为全球科技、经济乃至政治领域的重要话题。
在全球人工智能技术竞争日趋白热化的当下,中国科技企业正凭借独特的创新路径,深度参与这场意义深远的变革当中。业界评论普遍认为,DeepSeek的最大特点在于其作为开源模型,通过在模型架构、工程设计上的大量创新,实现了极致的效率提升,以更少的数据量和算力需求,达到了比肩全球领先闭源模型的性能表现,大幅降低了业界的开发成本和应用门槛,甚至改变了全球人工智能的发展思路。
DeepSeek 的成功,也将更多优秀的中国 AI 企业推向世界舞台的聚光灯下。近日,由麻省理工学院全资拥有的科技商业化智库《麻省理工科技评论》(MIT Technology Review)刊发了一篇题为《关注DeepSeek之外的四家中国人工智能初创公司》的报道,指出阶跃星辰(Stepfun)、面壁智能(ModelBest)、智谱AI(Zhipu)、无问芯穹(Infinigence AI)四家企业同样展现出不逊于DeepSeek的技术实力与全球竞争力。
《麻省理工科技评论》于1899年在美国麻省理工学院创刊,是世界上最权威的科技商业媒体之一,也是世界上最古老的技术杂志及影响力最大的科技商业化智库之一,其每年发布的 “十大突破性技术”榜单,更被视为全球科技发展的权威指南。
获得《麻省理工科技评论》点名的这四家备受瞩目的AI新锐中,首先是成立于2023 年4月,由前微软高级副总裁姜大昕创立的阶跃星辰。报道认为,虽然阶跃星辰起步相对较晚,但其凭借着一系列基础模型的成功,迅速崭露头角。去年,阶跃星辰已经发布了11款基础AI模型,涵盖了语言、视觉、视频、音频以及多模态系统等多个领域,其大型语言模型Step-2参数超1万亿,在第三方基准测试网站LiveBench上,仅次于ChatGPT、DeepSeek、Claude和Gemini的模型。
面壁智能由清华大学知名研究团队于2022年共同创立。报道指出,面壁智能专注于效率提升,顺应端侧模型发展趋势,推出了MiniCPM系列模型,被形象地称为“小钢炮”。该系列模型专为智能手机、个人电脑、汽车系统、智能家居设备乃至机器人等终端设备的实时处理设计,其最新的MiniCPM 3.0 仅有40 亿参数,但在多个基准测试中,性能与GPT-3.5不相上下;另一款模型MiniCPM-o 2.6,在平板电脑上实现了GPT-4o级别的效果。
同样源于清华大学的智谱 AI,已发展成为一家与政府、学术界联系紧密的企业。智谱AI既专注于基础模型研发,也基于模型开发了对话模型ChatGLM和视频生成工具清影(Ying)等一系列AI产品。其最先进的大语言模型 GLM-4-Plus 通过高质量合成数据训练,降低成本的同时,还实现了与GPT-4相媲美的性能表现;视觉模型 GLM-4V-Plus则在赋予AI更多“智能体”能力上迈出了重要一步。
同样是清华系的初创企业无问芯穹,虽然仅仅成立不满两年,但却已经吸引了近10亿元(1.4亿美元)的融资,并被誉为“中国CoreWeave”。报道指出,该公司专注于AI基础设施领域而非模型开发,其核心竞争力在于通过“多元异构、软硬协同”的核心技术,打造连接“M种模型”和“N种芯片”的“MxN”AI基础设施新范式,实现多种大模型算法在多元芯片上的高效协同部署,相当于将来自不同品牌的芯片整合在一起形成“异构计算集群”来执行各类AI任务。无问芯穹推出的Infini-AI异构云平台基于多元芯片算力底座,向大模型开发者提供极致性价比的高性能算力和原生工具链,为大模型从开发到部署的全生命流程降本增效,同时其大规模模型的异构分布式混合训练系统HETHUB,可将AI模型训练时长压缩30%,进而打造具有中国特色的高效解决方案。
从DeepSeek到四大新锐,中国AI企业正以独特的发展路径重塑全球AI的竞争格局。凭借在原创技术和工程层面实现突破,进而以更高的创新效率,快速追赶国际巨头、构建全新商业模式,乃至树立全球人工智能发展新标准,正是这些中国创新企业的共同特质。随着越来越多中国AI企业在全球舞台上崭露头角,不仅将成为推动中国 AI 产业稳健前行的关键力量,更将为全球AI发展贡献更多中国智慧,引领人工智能产业迈向新的发展阶段。
雷峰网(公众号:雷峰网)
雷峰网版权文章,未经授权禁止转载。详情见转载须知。