
新智元报说念
裁剪:裁剪部 HYZ
【新智元导读】加入Anthropic半年后,OpenAI联创又双叒下野了!这位强化学习前驱、ChatGPT中枢架构师下野,对Anthropic来说是一大亏空。
加入Anthropic才刚六个月的OpenAI联创John Schulman,又火速礼聘离开了!
此前,Schulman曾在OpenAI作事了9年。
前年8月份,他礼聘离开OpenAI,加入Anthropic。
那时,他在给前共事们的信中暗示,我方之是以作念此礼聘,方针是「真切我方对AI对都的存眷,开启我方功绩糊口的新篇章,转头到能躬行脱手的本领作事」。
而如今加入Anthropic才刚半年,他却又忽然礼聘离开。

Anthropic:暗示缺憾
Anthropic首席科学官Jared Kaplan在一份声明中暗示:「咱们对John的离开感到缺憾,但悉数支撑他追求新契机的决定,并祝福他一切顺利。」
有东说念主暗示,Schulman的下野对Anthropic是一种打击。他不仅是强化学习前驱,更是ChatGPT背后建树中枢架构师。

2024年8月,时任OpenAI「后考试」团队负责东说念主John Schulman,在推特上官宣入职强敌Anthropic。
那时这个音讯,就曾引起纷乱转动。
原因不单是在于,Schulman是OpenAI最受瞩方针本领首领之一,指导团队为ChatGPT获得冲破性效力作念出了枢纽孝敬。
他离开的时节也格外明锐。那时,正处于OpenAI的高管下野潮,CTO Mira Murati在内的其他高管,也险些在吞并时辰下野。
对此,Sam Altman致使格外注意地用了「大写字母」来发文恢复。

ChatGPT架构师,PPO一作
Schulman与OpenAI的结缘,是在有计划生学业完成后,以独创东说念主身份厚爱加入OpenAI。
于今,他已在OpenAI供职9年。值得一提的是,这是Schulman除实习除外,独一作事的公司。
之前,他负责的是对都团队,ag百家乐怎么杀猪随后他运行主顺次导「后考试」团队,对部署在ChatGPT和OpenAI API中的模子进行微调。

John Schulman本科在加州理工学院学习物理学,之后到加州大学伯克利分校攻读神经科学主义的博士。
那时,他对东说念主工智能也有点意思意思,但在其中并莫得看到访佛神经科学的可罢免的说念路。
直到参与伯克利的试验室交替神志时,他与Pieter Abbeel共同进行了直升机和机器东说念主方面的作事,由此决定转到EECS(电子工程和野心境科学)。

Schulman与OpenAI结缘已久。当作ChatGPT架构师,早在2015年还在读博士学位时,他就加入OpenAI成为市欢独创东说念主之一。
在一次采访中,Schulman说明了我方加入OpenAI的原因:
「我念念作念东说念主工智能方面的有计划,我合计OpenAI这家公司的作事嘻是图,况兼悉力打造通用东说念主工智能。」
「尽管,在那时批驳AGI似乎有些豪恣,但我合计运行谈判它是合理的,我但愿在一个所在批驳AGI是不错经受的。」
另外,据Schulman泄露,OpenAI将东说念主类反映强化学习(RLHF)引入ChatGPT的念念法不错细腻到2017年,那时Jan Leike和Dario Amodei等东说念主发表的一篇论文提到了这个法子。

论文地址:https://arxiv.org/abs/1706.03741
此外,2017年,Schulman在OpenAI任职时期也和团队初度提议了近端战术优化(PPO)算法,其变体PPO-Clip成为了OpenAI使用的主要算法。

论文地址:https://arxiv.org/abs/1707.06347
OpenAI安全团队之是以悉力于这项作事,是因为念念让模子顺应东说念主类的偏好,委果倾听东说念主类意见,并试图作念东说念主类念念作念的事情。
在GPT-3完成考试时,Schulman看到了扫数这个词有计划主义的后劲并决定加入这股潮水。
在好屡次采访中,Schulman都抒发了关于东说念主工智能下一前沿界限的见识:AI在更重荷的任务上抑制跨越的同期,东说念主类应该作念些什么?在哪些任务中,东说念主类不错在大模子匡助下有更大影响力,作念更多的作事。
此外,指路Schulman在个东说念主博客上发布的机器学习有计划指南,启航点是在2017年为OpenAI 有计划员规画 编写的。干货满满,值得一不雅。

著作地址:http://joschu.net/blog/opinionated-guide-ml-research.html
参考尊府:
https://www.theinformation.com/briefings/ai-researcher-john-schulman-leaves-anthropic?rc=epv9gi