ag国际
你的位置:AG庄闲游戏官网首页 > 投资者关系 > AG庄闲和游戏 不读博士,照样进OpenAI,o1核心成员现身说法了

AG庄闲和游戏 不读博士,照样进OpenAI,o1核心成员现身说法了

时间:2026-01-28 01:09 点击:58 次

AG庄闲和游戏 不读博士,照样进OpenAI,o1核心成员现身说法了

如果没有 PhD,是不是就和前沿 AI 研究没关系了?

至少在Noam Brown看来,未必。

这位OpenAI 研究员、o1 的核心贡献者,刚刚分享了一串"非典型研究员"的经历。

有人没有论文、有人没读研、有人白天在麦肯锡上班,晚上在 GitHub 写研究。

还有人没事就在推特发帖、GitHub 上提问的。

他们后来都去了哪?

OpenAI、DeepMind、Anthropic。

进 OpenAI,并不一定要博士学位

在这篇长帖中,Noam 分享了Keller Jordan、Sholto Douglas、Andy Jones、Kevin Wang等一批"非典型"研究员的经历。

总体看下来,他们都有一些相同的特质。比如,主动性极强(热爱)、公开研究,不闭门造车、工程能力在线、会 PR、不执着于头衔。

接下来,我们具体来看。

Keller Jordan:套瓷研究 + 推特学术

首先被 Noam 分享的,是Keller Jordan。

他现在在 OpenAI,从事预训练相关的研究。而他的研究生涯,某种程度上,起于一段典型的"套瓷研究"。

Keller 只有本科学位(UCSD),也没有任何论文发表经历。

毕业后,他先进入了一家做 AI 内容审核的初创公司工作。

在工作之余,他并没有闲着。

Keller 主动联系了当时还在谷歌的Behnam Neyshabur,并向他展示了一个针对 Behnam 最近论文的改进想法。

或许是出于"有人真的认真读了我论文"的成就感,Behnam 同意指导他。

最终,他们与其他作者一起,完成了一篇入选ICLR 2023的论文。

对于 Keller 这种"套瓷 + 研究"的方式,Noam 评价说:

遗憾的是,如今公开研究的空间比以前小了,但在已有论文基础上提出改进,依然是向实验室内部研究员证明你能力的绝佳方式,也能让对方有信心去帮你争取一次面试机会。

后来,一篇 2024 年底写下的一篇博客Muon: An optimizer for hidden layers in neural networks,则真正为 Keller 拿下了一张去 OpenAI 的船票。

(注:Muon 是专门用于神经网络隐藏层的优化器,核心思想是把常规梯度更新"正交化")

当时,Keller 发起并持续更新了一个 NanoGPT speedrun:

这个实验是在 Karpathy 的 NanoGPT 框架下,系统性地比较不同训练配置和优化器,目标是把预训练速度推到极限。

而 Keller 自己倒腾出的 Muon,正是在这一系列 speedrun 实验中,脱颖而出。

这引起了大神Andrej Karpathy的关注,Keller 也因此进入了 OpenAI 的视野。

而后续进入 OpenAI 也是顺手推舟。

这种把研究直接摊在 GitHub 上、同时在社交媒体上持续记录的方式,一方面让他的研究水平和产出变得异常容易衡量;

另一方面,也让这些工作没有淹没在 arXiv 的论文海里,而是被真正看见,并最终得到了圈内大神的认可。

说到底,PR 太重要了!

{jz:field.toptypename/}

Sholto Douglas:在 GitHub 上提问吸引大佬注意力

接下来,Noam 又分享了现 Anthropic 研究员Sholto Douglas的故事。

Sholto Douglas 曾经就职于谷歌,是 Gemini 项目的重要推手之一。

而他,也只有本科学位。

(没错,他还在清华交换了一年)

Sholto 本科学的虽然是机器人,但毕业后却进了麦肯锡工作。

而这,很大的一部分原因是,Sholto 没有申请到想去的研究生项目。

由此,Sholto 索性干脆一边上班,一边做研究。据 Sholto 在播客中的分享,他几乎是:

每天晚上 10 点到凌晨 2 点,周末每天至少 6 到 8 个小时,全都在写代码、做实验、搞研究项目。

在学习过程中,Sholto 还经常在 Google 开源的机器学习框架 JAX 的官方 GitHub 仓库上提问。

而这,引起了当时在谷歌,现在在 Anthropic 的James Bradbury的兴趣。

James 心想:这世界上还有我不认识的隔这提问的人?

于是,在看到了 Sholto 的提问以及他平时做的项目,James 就主动联系他,并邀请他前往 Google DeepMind 的面试。

最终,本科生,第一段工作完全不 AI 的 Sholto 进入了谷歌。

有趣的是,在进入谷歌之后,Sholto 才发现,自己被招进来,其实在某种程度上是一个内部实验: 

试试看,能不能把一个热情和主观能动性极强的人,和他们认识的最优秀的一批工程师配对,看看会发生什么。

andy jones:自学软件工程和机器学习,自费发论文

andy jones 现在是 Anthropic 的研究员,AG游戏APP负责的 RL 基础设施、沙箱系统,牵头多模态方向,以及参与大模型训练。

在此之前,他是一位半退休的量化分析师。

和上面几位一样,andy 有极强的主动性:他自费租赁算力,自费发表论文。

在论文《Scaling Scaling Laws with Board Games》中,andy 不仅首次系统地量化 train 与 test compute 的 tradeoff。

还在测试时计算扩展成为热门概念之前,比较了扩展预训练和扩展测试时计算的影响。

这篇论文直接让他成为机器学习领域的炸子鸡。

而后来,这一研究还直接推动了 o1 等模型的测试时计算范式,并被 Noam 放入了 o1 的技术报告里。

而据一位网友的补充,andy 的经历并不止如此。

他在英国完成了 4 年制的数学硕士,并且花 9 个月时间自学了软件工程和机器学习。

后来,他又干了一年的生物信息学研究。

再后来,3 年的量化交易工作已足以让他财富自由。

尽管如此,andy 并没有停下,而是完成了一系列独立探索,并最终进入 Anthropic。

Kevin Wang:进入 OpenAI 的本科生

此外,Noam 透露,像 OpenAI 这样的实验室,确实会直接从本科阶段招聘研究员。

而Kevin Wang就是其中一。

2025 年,Kevin Wang 在完成本科学习后,直接进入 OpenAI,从本科生一步跨入一线研究团队。

这并不是一次"破格的运气"。

一方面,Wang 拥有导师的强力推荐;但更关键的是,他本身就握着一篇极其扎眼的论文。

对于 OpenAI 来说,顶会上"水平还不错"的论文并不稀缺。真正稀缺的,是那种在第一眼就能被挑出来的工作。

{jz:field.toptypename/}

Noam 回忆,在 NeurIPS 2025 的5290 篇论文中,他们几乎是一眼就注意到了 Wang 的研究。

而后来的结果,也验证了这个判断——

他的第一作者论文《1000 Layer Networks for Self-Supervised RL: Scaling Depth Can Enable New Goal-Reaching Capabilities》,最终拿下了 NeurIPS 2025 最佳论文。

谈到招聘标准时,Noam 也给出了一个很现实的评价:

导师的推荐分量很重。因为仅凭简历,甚至只看论文,本身就很难全面评估一名研究员的真实水平。

最后,Noam 也分享了自己对"薪酬"的看法:

关于"薪酬"这件事:我认识一些人做量化是为了赚钱,但五年之后却开始反问自己——我到底在用人生干什么?

我们正处在一个非常特殊的历史时刻。做 AI 研究,你既有机会积极参与并引导这个时代最重要的技术发展,同时收入也相当可观。

我本科毕业后在量化交易行业干了一年,但并不希望自己此生对人类的"贡献",只是让股票市场稍微更有效率一点。

后来我选择降薪转去做 AI 研究——这是我这辈子做过最好的决定。放在今天,你甚至不需要降薪,也能走上这条路。

早进厂,没啥问题

除了 Noam 的分享以外,现在可能越来越明显的一点是:

想把研究做好、想进前沿 AI 大厂,博士学位本身,似乎已经不再是必需品了。

比如,GPT 论文的一作、CLIP 的一作Alec Radford,就是本科出身。

而现在 OpenAI 的首席研究员Mark Chen,也只有本科学历,一开始做的甚至还是量化交易。

在 Noam 那条帖子下面,有网友一针见血地总结过:

一条很棒的长帖,讲的是没有 PhD 学位的人,是如何进入前沿 AI 实验室做研究的。PhD 能给你导师和同行圈子,但它并不会自动赋予你好奇心、主动性,或者研究品味。

上面提到的Keller就是一个典型例子。

他是在完全公开的环境里做出了Muon 优化器,实验过程、结果都直接发在推特上。

甚至没有论文,只有一篇博客。

但影响力不言自明——现在 OpenAI、Kimi、DeepSeek 都在使用它。

类似的故事并不少见。

比如 Stability AI 的 80 名研究员和工程师中,只有 16 位拥有 PhD,而且其中相当一部分是直接从推特上招来的。

换句话说,你不需要 PhD,才能成为一名优秀的研究员或工程师。你只需要真的去做事,而且让别人看得见你在做什么。

前几天刚上《WhyNotTV》的嘉宾——

从 GPT-3.5 到 GPT-5 都有深度参与、负责 GPT post-training RL infrastructure 的核心成员翁家翌,也是只有硕士学位。

在播客里他也提到:相比去读一个 PhD,尽早进入工业界比较好。

因为等 PhD 读完,研究范式可能已经换了一轮;

而且博士阶段往往面对的是 toy benchmark,而不是真实世界的系统和约束。

与此同时,很多 AI Lab 真正短缺的,反而是工程能力极强的人。

至于能不能进、进了之后做什么,很大程度上取决于:实验室当下需要什么,以及你是否已经在过往经历中证明过自己能补上那块拼图。

回到顶部
服务热线
官方网站:024jjzs.com
工作时间:周一至周六(09:00-18:00)
联系我们
QQ:2852320325
邮箱:024jjzs.com @qq.com
地址:武汉东湖新技术开发区光谷大道国际企业中心
关注公众号
ag国际手机App

Copyright © 1998-2026 AG庄闲游戏官网首页™版权所有

024jjzs.com 备案号 备案号: 辽ICP备2020012714号-1

技术支持:®ag国际  RSS地图 HTML地图