开云(中国)Kaiyun·官方网站 - 登录入口  首创东谈主梁文锋的汉文华访更是被翻译成英文-开云(中国)Kaiyun·官方网站 登录入口

发布日期:2026-03-31 12:02    点击次数:170

开云(中国)Kaiyun·官方网站 - 登录入口  首创东谈主梁文锋的汉文华访更是被翻译成英文-开云(中国)Kaiyun·官方网站   登录入口

专题:DeepSeek为何能飘摇巨匠AI圈开云(中国)Kaiyun·官方网站 - 登录入口

  来源:IT之家

  “玄妙东方力量”DeepSeek 给硅谷带来的影响,还在不休泛起飘荡 ——

  刚刚,DeepSeek-R1 踏进大模子竞技榜前三。以开源、低廉 20 倍的“身价”与 ChatGPT-4o(2024.11.20)比肩。

  在复杂领导词 / 格调死心榜单上,R1 位列第一。

  目下服从来看,它在各个维度上王人保合手当先。

  在测度模子编程开辟身手的 WebDev 分榜上,R1 位列第二,与闭源的 Claude 3.5 Sonnet 进出不到 40 分。

  网友实测体验示意,如实如斯,R1 在 30 场 battle 中只输了 4、5 次。

  另一边,硅谷对 DeepSeek 的意思意思不减。

  毕竟,它然而一个“副业”。

  首创东谈主梁文锋的汉文华访更是被翻译成英文,“拿着放大镜”逐字崇拜阅读。

  他建议的不雅点也被追忆成箴言,在互联网精湛传。

确凿的差距不是 1 年或 2 年,而在于是原创如故师法。

  图灵奖得主 LeCun 也为 DeepSeek 作念出中肯评价:

它代表了开源的力量。

这意味着,开源模子正在高出专有模子。

  值得一提的是,同为开源领域代表的 Meta 刚刚公布了 2025 年在 AI 领域的布局想象:650 亿好意思元,投算力、投东谈主才。

  有爆料称,Meta 里面依然因为 DeepSeek 感到焦躁。

  “他们让 OpenAI 一次又一次看清我方”

  是以,在硅谷视角里,他们更矜恤 DeepSeek 的哪些信息?

  最紧要的莫过于,DeepSeek 如何赢利。

  挖到的信息有点出其不意,大概 DeepSeek 还没念念赢利的事。

控股 DeepSeek 的是幻方量化,他们有一批顶级科学家,有充裕的算力资源,DeepSeek 其实是一个“副居品”。

在 2023 年末我就据说他们在作念 DeepSeek。即使在那时的中国,还莫得东谈主把他们当回事。

  其次,为何 DeepSeek 能顺利。梁文锋在 2023 年 5 月 2024 年 7 月领受暗涌的两次采访,也被老外扒出来了。

  他们最矜恤的五个方面差别是:

  1、创新第一性原则:与其他勤劳于快速交易化的中国 AI 公司不同,DeepSeek 专注于基础的 AGI 扣问和创新。他们认为,中国必须从巨匠东谈主工智能发展的“搭便车者”搬动为“孝顺者”。梁文锋说,创新不统统是交易驱动的,还需要意思意思心和创造欲。

  2、创新性架构:DeepSeek V2 中采取的新式 MLA(多头潜在戒备力机制)架构,把显存占用降到了畴昔最常用的 MHA 架构的 5%-13%,实现了本钱大幅裁汰。它的推理本钱仅为 Llama 370B 的 1/7、GPT-4 Turbo 的 1/70。

  这并不是为了挑起一场价钱战 —— 他们只是在“本钱上稍许有点利润”来订价。这种创新架构不时期骗于 V3 和 R1 模子中。

  3、私有的公司文化和东谈主才计策:DeepSeek 保合手着一个统统从下到上的组织结构,为扣问东谈主员提供无穷的诡计资源,优先看创造状貌而不是文凭。他们的冲破性创新来自年青的原土着才 —— 中国脉土的应届毕业生和年青手艺东谈主才,而非国际招聘。

  4、勤劳于开源:尽管行业启动趋向于闭源模子(OpenAI 和 Mistral),DeepSeek 仍勤劳于开源,并认为开源关于确立一个庞杂的手艺生态系统至关伏击。梁文锋认为,在颠覆性手艺眼前,闭源酿成的护城河是移时的。

  他们的确凿价值在于确立一个具备创新身手的组织。

  5、底层诡计挑战:尽管领有充足的资金和手艺,DeepSeek 也濒临来自底层诡计的挑战和压力。目下公司还莫得新的融资想象。梁文锋认为,濒临的主要制约身分不是资金,而是高端算力的使用权,这些芯片关于覆按先进 AI 模子至关伏击。

  除此除外,采访中的诸多细节也被网友崇拜试吃。

  原文中,梁文锋被问谈:如何看待作念量化同期作念多数基础研发,不烧钱吗?

  他回话:一件清翠东谈主心的事,大概不成单纯花钱测度。就像家里买钢琴,一来买得起,二来是因为有一群急于在上头弹吹打曲的东谈主。

  国际网友感触:

这帮东谈主是一群有点理念念化的“手艺狂”,他们深信我方能搞出通用东谈主工智能(AGI),而况他们如实有这个资源和天禀。我果然太可爱他们了!

  此外也幸免不了一些对比:

梁文锋展现出一种统统不同的心态,他们的顺利当之无愧,我也很期待看到他们一次又一次让“OpenAI”认清我方。

  虽然放眼 AI 领域的全体发展,能够看到 DeepSeek,关于总计东谈主而言大概王人是沸腾的。

尽管我忍不住以为他们有点活泼,毕竟在交易化上他们有点“自断后路”。但看到一个团队坚合手理念念并取顺利利,如实让东谈主以为很愉快。

  跟着 R1 的惊艳亮相,DeepSeek 正在完结我方所说的一切。拓宽手艺规模、坚合手开源、专注于手艺开辟……

  那么,DeepSeek 是如何走到当今的呢?

  用 AI 作念量化,再回到 AI

  梁文锋本硕均就读于浙江大学信息与电子工程学专科。

  2008 年,梁文锋毕业,启动指导团队使用机器学习等手艺探索全自动量化来往。

  那时量化在国内如故个崭新认识,能否赢利是个未知数。2010 年沪深 300 股指期货推出,量化投资迎来春天。据公开信息涌现,梁文锋团队恰是乘上这鞭策风,很快自营资金升迁 5 亿元。

  与此同期,深度学习海浪的齿轮启动动弹,东谈主工智能率先在硅谷爆发。

  2015 年,梁文锋与学友共同创立幻方量化。只是 1 年后,他们就推出了旗劣等一个 AI 模子,第一份由深度学习生成的来往仓位上线扩充,使用 GPU 进行诡计。

  2017 年,幻方量化声称实现投资策略全面 AI 化。

  2018 年,幻方量化成立 AI 为公司的主要发展标的。

  AI 加合手下,幻方量化旗下基金讲演率远超同期沪深 300 指数。2019 年,资金科罚限制冲破百亿元。

  2019 年,梁文锋在当年的金牛奖授奖典礼上,发表主题演讲《又名环节员眼里中国量化投资的将来》,这是他稀有的公开演讲。

  演讲全文的确充满“环节员视角”:

量化公司是莫得基金司理的,基金司理即是一堆做事器。东谈主来作念投资有商酌的时刻,它是一种艺术,要凭嗅觉。环节来有商酌的时刻,它是一种科学,它有最优解。

  亦然这一年,幻方量化启动大限制布局 AI 算力,搭建起“萤火一号”集群。2021 年,“萤火二号”落成。这么的算力基建,成为如今 DeepSeek 快速奔走的底层撑合手。

  2021 年,幻方量化成为国内首家冲破千亿限制的的量化私募大厂,被称为国内量化私募“四大天王”之一。

  值得一提的是,在幻方量化的官网上,AI 基础科学扣问弥远占据伏击位置,包括在大模子海浪前。

  幻方量化曾示意,多年以来,该公司坚合手把营收的大部分参预东谈主工智能领域,栽植当先的 AI 硬件基础要领,进行大限制的扣问,探索东谈主类未知的隐秘。

咱们信托险些总计的创新王人是从斗胆尝试和点滴积贮中助长而来。

  2023 年,幻方量化将下场作念大模子的孤苦新组织定名为深度求索,并强调将专注于作念确凿东谈主类级别的东谈主工智能。

  主义不是复刻 ChatGPT,而是扣问和揭秘 AGI 的更多未知信息。

  DeepSeek 的故事也就启动于这一刻。

  一个 80 后环节员在搅拌中国量化市集后,完成资金积贮,组建起年青茁壮的团队,似乎又回到了他原来的起首、回到 AI,但产生的能量正在巨匠掀翻骇浪。

  One More Thing

  值得一提的是,幻方量化还经久向慈善机构捐赠,官网闪现公司职工“一只平素的小猪”个东谈主捐助 1.38 亿元,支合手 15 家慈善机构的 23 个公益名堂,在寰球范围内匡助颓势群体,促进社会的公温煦发展。

  爆料音信称,这个职工即是梁文锋本东谈主。

  参考聚会:

[1]https://www.reddit.com/r/LocalLLaMA/comments/1i6dlvj/inside_deepseeks_bold_mission_ceo_liang_wenfeng/

[2]https://www.threads.net/@yannlecun/post/DFNvN3euNEV?xmt=AQGzPcW8Rr7oXT6-rHIoKzBNL5x2PNnaprvJBL6uIhgoQA

[3]https://finance.eastmoney.com/a/202501223304127161.html

[4]https://mp.weixin.qq.com/s/r9zZaEgqAa_lml_fOEZmjg

  本文来自微信公众号:量子位(ID:QbitAI),作家:明敏

海量资讯、精确解读,尽在新浪财经APP

包袱裁剪:丁文武 开云(中国)Kaiyun·官方网站 - 登录入口