巨屌 twitter
头图由豆包生成 教导词:打工东谈主,坐在电脑前拚命职责,办公室场景
作家 | Jessica
邮箱 | JessicaZhang@pingwest.com
OpenAI发布旗舰推理模子o3和o3-mini,成为他们2024年的收官之作,制造了一波小昂然。和往常同样,Twitter (x.com)依然是外网商讨的主阵脚。
但有件事不知你发现没,这次来自OpenAI“我方东谈主”的声量彰着增强了——险些整个治有x账号的OpenAI职工都在发文,为公司的时弊模子更新站台助威。
网友们越刷推越发现,放眼望去,如何满寰球都是OpenAI的工程师和议论员。而且这次不再局限于那几个耳闻目染的名字,通盘团队都出来了。
此情此景,是不是还挺练习~Twitter上的OpenAI职工们,像不像在一又友圈极力为东家“商业”的你?
1
OpenAI全员共创o3盛事之:
教会班子带头PR
掌门东谈主奥特曼无谓多说了:从发布前急不可耐以“oh oh oh”暗意新品,邀请行家肯求o3测试权限;
到强调o3-mini编程弘扬以权贵缩小的资本超过o1,在线感恩团队成员的穷苦付出,称行家一王人职责是“东谈主生中最大的鼎沸之一”;
再到多样一键三连共事们的o3推文,吵杂极端。
上个月刚结果"东谈主生中最长假期"的OpenAI聚拢首创东谈主兼总裁Greg Brockman,回来后一直在精细互助公司的每一步动作,费力搞宣发。
o3上线后他发声力赞:新模子在最具挑战性的测试中终显着质的飞跃,径直达到一个全新的高度。
首席产物官Kevin Weil和议论副总裁Mark Chen分袂转发ARC-AGI测试封闭和o3-mini团队的推文。
新任OpenAI首席信息安全官Dane Stuckey也来“一二三巨屌 twitter,上同一”了,赞佩这是“何等令东谈主振作的一天”。
特情理的是,Stuckey大致四年前就注册了推特账号,而直到本年10月他离开Palantir Tech,官宣加入OpenAI后,才运行认真发文。何况一改往日低调,变得格外活跃。
主创团队联袂登场
在这次发布直播中,年青的华东谈主议论员Hongyu Ren当作团队代表,审视先容了轻量级模子o3 mini。
他随后在推特上发文,重心进修o3 mini的超卓性能,包括其高效性、资本效益以及生动可调的推理时刻。还特地提到了几位参与o3-mini研发的中枢成员,向他们致意。
几位主创也纷繁发文回复,称o3-mini是“一个灵敏的小怪兽”、“速率极快”、领有“惊东谈主的数学和代码性能”,谈话间自负之情尽显。
其实,这些议论员们在业内照旧颇有配置。稽查他们的布景就会发现,不少东谈主都是o1和o1-mini的要津孝顺者。不外这一波官宣也确乎让更多公众意志了他们,以OpenAI的造星才略来看,出几个新的大模子界KOL偶而班师在望。
各组共事扎堆夸夸
这次“OpenAI夸夸团”的团友之多:惟有点进一位职工的x账号,就梗概率能顺着多样"套娃式"转发,连环点进其他几位共事夸赞o3的推文里。
搞得咱们都怀疑奥特曼是不是下达了什么打算,把加多o3曝光度也算进职工KPI里。
在微软议论院职责了十年、曾担任AI副总裁及特出科学家的著明筹备机大佬Sébastien Bubeck,于本年10月入职了OpenAI。他在置顶推文中坦言,o3和o3-mini是我方为止目前最可爱的模子,o3各项评估简直封神,特地是前沿数学25%的测试得益。
教会过GPT-4o预现实和o1开拓的议论员Aidan Clark更是连发五条,激赞“Hongyu 真得太利弊了”,露出o3-mini是第一个让他确切能提议难题的模子。
专注GPT增长的期间团队成员Anshita Saini说,o3给东谈主的嗅觉很不同样。通盘o3系列的理念会让她停驻来念念考“一个将AGI产物化的寰球是什么步地”。
很很鲁很很很鲁很很鲁在线视频播放议论东谈主员在线剖析
除了以上这种直给式力挺,还有一些OpenAI议论员承担了答疑解惑的脚色,试图通过共享不雅点来见解一些问题。
o3和o3-mini的发布给社区带来立志的同期,也激发了一些争议和质疑。有东谈主因为ARC-AGI的测试效果应承AGI近在目下,致使照旧终了;也有东谈主嗤之以鼻,对o3崇高的算力需乞降运营资本露出担忧,吐槽这不外是又一个"画饼"产物。
对此,OpenAI多模态推理议论员Noam Brown发文露出:外界对ARC-AGI测试的反映有些过度,封闭ARC-AGI基准并不料味着模子已达到AGI水平。他还提到了AI鸿沟的一个多数景象:东谈主们频频合计某个基准测试需要"超智能"才气完成,但当确凿有模子攻克这个基准时,东谈主们又会因为它莫得达到预期中的"超智能"水平而感到失望。
音在弦外:请感性对待,不要捧杀。
OpenAI API工程主宰Sherwin Wu对此深表赞同,Sherwin提醒社区:比起ARC-AGI测试,o3在编程和数学上的封闭才更值得平和——o3的编程水平照旧超过了我方,而o3能答对四分之一的前沿数学题目我方更是一谈都解不出。
另外,针对o3模子是否使用特定数据集、通过特定鸿沟优化、或东谈主为调遣教导风光来提高评估效果的质疑,公司议论员Brandon McKinzie和Rhythm Garg接踵回复:
评估中使用的arc-agi群众现实集仅是更大o3现实数据的一小部分,无法决定模子弘扬;o3是通用模子,未进行任何特定鸿沟的微调;ARC-AGI高分并非依赖调遣教导,而是模子通用性和现实效果的当然体现。
对于o3的崇高价钱,议论员Nat McAleese这么解释:诚然o3是目前测试阶段资本最高的模子,但它开启了一个"用筹备换性能"的新时期。通过加多测试阶段的筹备量,o3将模子性能晋升到了一个"令东谈主难以置信的水平"。
Nat合计,尽管目前确乎很贵,但跟着期间越过,token价钱会渐渐缩小。更要津的是,团队照旧找到了一种能够高效地将筹备量升沉为性能晋升的圭臬,这预示着畴昔AI模子的才略还将大幅晋升。
终末是OpenAI模子现实速率的问题。在汉文社区颇有影响力的Jason Wei露出:从o1到o3的升级仅用了三个月时刻,讲解了基于念念维链的强化学习新范式,比传统预现实方式每1-2年才气推出一个新模子的节拍要快得多。
连OpenAI日本办公室总裁Tadao Nagasaki也出来恭维:“咱们不是才在九月份发布了 o1?目前照旧运行对o3 早期评估了!”
1
集体商业要传达什么信息
这次OpenAI职工集体为o3发布背书,当先是出于对产物的高度自信。通过不同角度的解读,他们但愿外界能够更全面地了解o3在数学、编程和推理方面的封闭性成就。OpenAI特意向外界展示:我方依然是AI期间的教会者,在竞争者四起的商场上存在感依旧。
此外,在现时OpenAI靠近外界质疑、竞争压力加重的要津时刻点,加之中枢职工泛泛流失以及“吹哨东谈主”风云的影响,全员商业也带有了多少“抱团取暖”的意味。他们试图借这次发布向社区传递几个信号:
1. 扩张礼貌有新封闭
多位OpenAI议论员指出,o3和o3-mini考证了加多筹备资源、数据量和模子参数确乎能带来权贵性能晋升,何况封闭了传统扩张礼貌“递减效益”的贬抑,讲解模子在畴昔仍有巨大的晋起飞间。
2. 期间翻新莫得“撞墙”
职工们通过转发测试数据和审视解读,强调o3系列的理念和性能封闭了很多东谈主对AI模子领域的遐想,不仅在性能上获得了超过预期的封闭,也展现了更世俗的适用性。比较外界对GPT-5“难产”的传言,OpenAI想讲解他们正在开辟另一条翻新之路。
3. 现实速率并未放缓
面对外界对于OpenAI模子迭代速率的质疑,特地是在全球AI竞争日益热烈的布景下,从o1到o3的飞速升级成了明确回复。标明OpenAI有才略封闭传统预现实1-2年的开拓周期,以更快的速率推出高质料模子,踏实商场信心。
回特地看,从上线o1郑再版到官宣o3巨屌 twitter,这12天期间直播更像一场威望广泛的OpenAI大秀。旧年这个时候,那场颠簸全网的"OpenAI is nothing without its people"全员声援才刚刚终止。一年往时,OpenAI弗成说不好,却也不复也曾GPT时的巅峰后光。在阅历了多样高下障碍后,偶而每位职工都想在年底拼一把来make OpenAI great again。