经观头条|关于DeepSeek的误读与幻觉
无论如何,对DeepSeek产生的幻觉,同样由好奇心所激发,这或许正是创新的一体两面。正如其创始人梁文锋所言:“创新不完全是商业驱动的,还需要好奇心和创造欲。中国的AI不可能永远跟随,需要有人站到技术的前沿。”
当硅谷陷入算力军备竞赛时,一家中国AI公司回归算法创新,给出算力崇拜时代的另一种答案,诠释了创新的另一种可能。
DeepSeek的大模型以低成本、高性能、“诚意满满”的开源撕开AI普惠的裂缝,让医疗、金融、教育等行业的智能化进程加速。
从美股科技股风暴到A股概念股涨停,从硅谷巨头的焦虑不安到开源社区的兴奋不已,DeepSeek的创新重写AI叙事。这不是一场参数竞赛的终局,而是一扇通向技术平权与产业裂变的门。
无论如何,对DeepSeek产生的幻觉,同样由好奇心所激发,这或许正是创新的一体两面。正如其创始人梁文锋所言:“创新不完全是商业驱动的,还需要好奇心和创造欲。中国的AI不可能永远跟随,需要有人站到技术的前沿。”
DeepSeek横空出世带来的冲击还在持续。港股和国内A股市场的科技股受其影响拉开了一轮新的上涨。国内券商研报认为,DeepSeek的强推理能力、低算力成本、开源属性,使得AI(人工智能)应用的普及成为可能,投资者似乎看到了AI应用的广阔市场前景。
从开年的TikTok在美被封禁到后来的DeepSeek爆火,当越来越多的中国科技公司被迫架上“战车”,对这些公司本身的发展来说,真的是件好事吗?
三个连续20%的涨停之后,2月7日,每日互动(300766.SZ)的股价已经涨至39.97元,较其第一个涨停之前的股价,翻了一倍,市值超过150亿元。
2月5日以来,国内主要云厂商联通云、京东云、阿里云、腾讯云、百度智能云和移动云等纷纷上线DeepSeek大模型,并将其纳入各自的模型商店。国际云厂商微软云和亚马逊云科技早在春节前就上线了DeepSeek。
在DeepSeek概念股的领涨下,2月5日,与AI(人工智能)模型相关的云计算、智谱AI、华为鸿蒙、大数据、ChatGPT等相关指数涨幅均超过5%。
变革从来不是选择题,而是生死题。当DeepSeek们用自组织推开新世界的大门,留给传统企业的时间可能比想象中更加紧迫。
从“烧钱信仰”到“效率革命”,市场对这些AI公司的高估值正逐渐产生怀疑。而DeepSeek-R1的崛起或许证明,AI的未来不再单纯依赖于硬件(算力)的不断升级,更取决于算法的创新与效率的极致提升。
DeepSeek发布的测试结果显示,Janus-Pro的70亿参数版模型在一些基准测试中击败了美国AI独角兽OpenAI的多模态大模型DALL-E3。
DeepSeek在大模型上取得的成功成为海内外关注焦点。
AI世界从来不只是巨头的独角戏。来自中国、成立仅一年半的人工智能创业公司深度求索(下称“DeepSeek”),使用2048颗英伟达H800 GPU,用时短短两个月,训练出了6710亿参数的开源大模型DeepSeek-V3,直接赶超美国AI巨头OpenAI投入超百倍的顶级模型GPT-4o。
谁也没想到,关于AI的新可能性居然会出现在一家中国的量化投资机构上。哪怕现在DeepSeek-V3出现了各种各样的“幻觉”——比如在回答的时候认为自己是ChatGPT,但没有人会否认,在保证同样性能却大幅降低成本这件事情上,它确实成功了。
经济观察报 经济观察网 www.eeo.com.cn
地址:北京理工大学国防科技园2号楼4层 | 邮编:100081 | 电话:4001560066 | 传真:86-10-88510872
广播电视节目制作经营许可证 (京)字第12950号 增值电信业务经营许可证 B2-20214402 京网文(2020)3373-581号
备案号:京ICP备18019893号 京公网安备 11010802028547 @2001-2022经济观察网版权所有
经济观察网手机版