89. 离开 Meta 加入 Startup (嘉宾:张明瑞)
Watch it on Youtube. Or listen on your favortie podcast app.
Show note
欢迎来到新一期的“李丁聊天室”!
休息数月后,明瑞带着全新的身份回归:他离开了 Meta,加入了一家名为 Reflection.ai 的初创公司。这家被称为“美国版 DeepSeek”的公司究竟在做什么?AI 时代的面试和研发逻辑又发生了哪些巨变?本期节目我们将深度复盘明瑞的求职心路历程,并探讨大厂与小公司在 AI 研发上的本质差异。
- Reflection AI 融资:https://reflection.ai/blog/frontier-open-intelligence
- Andrej Karpathy Youtube: https://www.youtube.com/@AndrejKarpathy/videos
时间轴:
- 00:00 近况更新:结束长假回国,明瑞分享换工作与搬家的双重变动
- 01:34 新去向揭晓:加入 Reflection.ai,解析为何这家公司被称为“美国的 DeepSeek”
- 03:10 创业公司的方向转变:从 Coding Agent 转向通用大模型,解析初创公司的灵活性与融资背后的故事
- 05:50 人才虹吸效应:为什么 DeepMind 的顶级人才会纷纷加入小公司?
- 09:01 求职策略分享:如何调查 VC 背景?为什么线下约咖啡 (Reach out) 比直接投简历更有效?
- 12:30 AI 时代的求职 Vibe:避雷“老印”文化,寻找背景多元化且有激情的年轻团队
- 16:57 面试实战复盘:抛弃 LeetCode 八股文,如何准备 AI 领域的 Paper 与专业知识?
- 21:02 不一样的面试 Style:手写线性 Transformer、设计下棋 Agent,甚至允许使用 Claude 辅助
- 24:39 AI 工具的争议:程序员该不该“All in Cursor”?面试中如何考察 AI 协同能力?
- 28:46 大厂面试槽点:45 分钟两道 Hard 题的 Staff Level 面试是否还有意义?
- 33:30 Super Set 研发观:从造发射器到造火箭,创业公司如何在高压 Timeline 下交出模型答卷
- 36:13 Gemini 为什么能赢?深度解析 Infrastructure (基建)、Data (数据) 与人才流动的胜负手
- 41:25 DeepSeek 的影响力:算法开源如何打破美国的技术垄断?为什么 Qwen (通义千问) 最好用?
- 47:00 创业公司的“野蛮地带”:习惯了 Meta 成熟的内部工具,如何在没有 Infra 的初创公司“手撸”代码?
- 52:04 职场反思:离开 Meta 是正确的决定吗?大厂 Politics vs 创业公司成就感
- 56:40 研发机制对比:半年一次的 PSC (绩效考核) 是如何毁掉深度探索 (Deep Exploration) 的?
- 01:04:47 尾声:下期预告,纽约、旧金山、伦敦职位内推机会
关注我们: https://lidingzeyu.com/podcast/subscribe
如果你喜欢本期节目,请不要忘记点赞、订阅并分享给你的朋友!也欢迎在评论区留下你的想法和问题。
李丁的联系方式:
- Signal (+1) 206-745-2849
- 邮件 podcast@dingzeyu.li
- Whatsapp (+1) 206-745-2849
- Youtube 留言:https://youtu.be/VA4L-a9dnt8
- 微信 ID 是 "李丁泽宇" 的拼音
联系李丁来聊聊天啊!
制作团队
- 李丁泽宇 (https://dingzeyu.li)
Full transcript text
(AI 生成的文字稿,可能有错误,请自行分辨)
- 00:00 之前这个休更呢
- 00:01 有一段时间了
- 00:02 然后最近刚好明瑞有一些
- 00:04 这个 update 想跟大家分享
- 00:05 然后我自己
- 00:05 我现在还没想好这期要聊什么
- 00:08 但是根据这个明瑞聊的
- 00:10 说不定我也有一些
- 00:10 想分享的东西
- 00:12 可以可以
- 00:13 大家好
- 00:14 我们好久没见了
- 00:16 就是前几个月我回国了一趟
- 00:19 然后有几个比较大的消息吧
- 00:23 一个是最近换工作了
- 00:27 所以就是回国
- 00:28 然后休息整顿之类的
- 00:31 就基本上都是因为要换工作
- 00:33 就是当初我七月底面试
- 00:36 然后八月份拿到 offer
- 00:38 然后我就决定稍微休息一下
- 00:41 所以就好久没有跟李丁联系
- 00:43 对对
- 00:45 我觉得当时我们一开始录节目的时候
- 00:47 还是你在聊这个在 Meta 内部换组的事情
- 00:49 这个换组就快一年了
- 00:51 刚好你觉得又是一个好的时间
- 00:53 出来找新的工作了
- 00:56 对对对
- 00:57 这次跟上次不一样
- 00:58 上次更多的是
- 00:59 在之前的组
- 01:01 干的不是很开心
- 01:03 然后这次感觉更多就是
- 01:04 找到一个更好的机会
- 01:07 我觉得这一期可以
- 01:09 专门讲一讲
- 01:10 然后如果没讲完
- 01:12 也可以多更一下
- 01:14 然后另外就是
- 01:16 我最近刚搬家
- 01:17 所以如果看背景就变了
- 01:20 反正最近就挺忙的
- 01:22 所以今天终于是有时间
- 01:24 放松一下
- 01:26 然后聊一聊
- 01:27 回顾回顾
- 01:28 对可以可以
- 01:30 那对你说你是七月底
- 01:32 八月面试的
- 01:34 然后最近刚刚入职
- 01:35 这新公司是什么呢
- 01:36 你是想跟大家分享吗
- 01:38 对我跟大家
- 01:39 我就先大概说
- 01:41 就是我加入的公司
- 01:44 叫做 reflection.ai
- 01:46 他们是做那个
- 01:48 开源大模型的
- 01:50 就他们的
- 01:51 怎么说
- 01:52 他们的这个标语
- 01:54 就是要做
- 01:54 美国的 DeepSeek
- 01:56 如果你去他网站搜
- 02:01 他们现在就说
- 02:01 他们要做这个 open model
- 02:03 open language model
- 02:05 但是我
- 02:06 然后我是三周前加入
- 02:10 所以我相当于是八月底
- 02:13 拿到 offer 之后
- 02:14 我就跟他说
- 02:15 能不能三个月之后加入
- 02:16 因为我 9 月要回国
- 02:18 不确定那个签证之类的东西
- 02:20 然后感觉他们也比较
- 02:22 比较随意
- 02:23 所以就我刚刚加入
- 02:26 然后大致的这个时间线是
- 02:29 我在
- 02:30 我在年初的时候换组
- 02:34 就是上一次换组之后
- 02:35 我就有一些这种想法
- 02:37 就是我想
- 02:38 不时的看一看外面的机会
- 02:42 然后尤其是这种创业公司
- 02:44 所以其实在年初的时候
- 02:45 我就开始找
- 02:46 主动的去找一些公司
- 02:48 然后去投
- 02:50 集中在这个夏天的时候
- 02:53 就更多的
- 02:54 在这上面花了点功夫
- 02:56 然后
- 02:57 7 月的时候联系了这个公司
- 03:01 8 月的时候
- 03:01 7 月底面试
- 03:03 然后相当于就最后是尘埃落定
- 03:06 对
- 03:08 大致就是这么一个情况
- 03:09 对
- 03:10 那你这次面试的过程中
- 03:12 跟你当时在 Meta 内部换组面试
- 03:14 有什么不一样的感受吗
- 03:16 我觉得主要是
- 03:20 就首先我
- 03:21 怎么说
- 03:23 我感觉这是相当于
- 03:25 跟我当初计划的很像
- 03:27 就是我当初把之前那个组
- 03:29 更多的看成是
- 03:30 我想提高技能
- 03:32 以及往这个领域
- 03:34 前进的一个步骤
- 03:35 然后之后
- 03:37 我肯定是会更多的像这种
- 03:39 我感兴趣这种大语言模型
- 03:42 或者是这种跟应用相关
- 03:44 就 AI 之类的
- 03:45 然后向小公司靠拢
- 03:47 然后我觉得这算是一个
- 03:48 在我计划之中的事
- 03:50 但我不确定它什么时候发生
- 03:52 所以当时我就很焦虑
- 03:54 我当初不太一样的一点
- 03:56 就是你
- 03:58 对这些公司都不是很了解
- 04:01 就是 Meta 组里面的话
- 04:03 你有很多熟人
- 04:04 或者是你可以看他们的 code
- 04:06 你可以看不同人的 profile
- 04:08 你就大致知道这些组是做什么的
- 04:12 然后重不重要
- 04:12 然后他们跟你做的兴趣相不相关
- 04:15 我这一次我觉得有几点吧
- 04:18 我虽然还没有写
- 04:19 就是写下来总结
- 04:22 但是我现在就先
- 04:23 即兴地去想一下
- 04:25 就有一点是
- 04:27 很
- 04:29 就是这个公司到底做什么
- 04:32 尤其是创业公司
- 04:33 很不明确
- 04:34 因为我这个公司的背景是
- 04:36 当初我在面的时候
- 04:38 他们是做 coding agent
- 04:40 然后他们主要是向企业
- 04:43 提供这种 code understanding 的平台
- 04:46 比如说他们做的
- 04:47 第一个产品叫
- 04:48 就是 Asimov
- 04:49 然后做的就是相当于一套
- 04:52 理解你这个 codebase
- 04:54 然后给你
- 04:55 然后能连接到你
- 04:57 比如说邮件或者 Slack 这种
- 05:00 然后你问一个问题
- 05:01 他能综合所有的内容
- 05:02 来给你一个回答说
- 05:03 因为这个比如说 CI/CD 挂了
- 05:06 是因为谁刚 modify
- 05:08 或者哪个 code
- 05:09 就感觉比 Claude Code
- 05:11 可能更综合一些
- 05:14 就不只是看 code
- 05:15 然后他们想做这个的时候
- 05:17 我就觉得
- 05:18 很有意思
- 05:19 因为如果最后做出一个终端的产品
- 05:22 就是给客户用的话
- 05:24 有很多这种就跟 Cursor
- 05:25 或者是什么 Windsurf 一样的这种
- 05:28 就是你是要去 design 一个这种 editor
- 05:31 然后中间有很多跟他交互的步骤
- 05:34 我觉得很有意思
- 05:34 所以我当时面的那个职位是 agent researcher
- 05:39 就是想怎么样 design 这些 agent
- 05:42 然后并且怎么去这种设计 task
- 05:45 做环境然后 train 他们
- 05:47 但是我接到 offer 之后
- 05:50 他们在十月就完全改变方向
- 05:53 也不是完全
- 05:54 就是相当于是一个大跨步
- 05:55 因为他们拿到了很多投资
- 05:58 所以相当于因为有了这些钱
- 06:02 投资方的一些这种期待
- 06:05 他们就转型成了一个
- 06:07 更 general 的一个
- 06:09 这种 modeling company
- 06:10 我觉得就跟什么 Mistral
- 06:12 或者是
- 06:14 就跟国内的这种 Qwen
- 06:17 Qwen 或者是什么 DeepSeek
- 06:19 这种类似的一样
- 06:21 然后这样的话
- 06:22 就能吸引更多的
- 06:24 一个是能吸引更多的人才
- 06:26 就是可能你以前
- 06:27 你说我是做 coding agent 之类的
- 06:29 然后很多
- 06:30 就我们现在
- 06:31 我们创始人有一个
- 06:33 是做当初 AlphaGo 的
- 06:35 相当于是 research engineer 的一个 lead
- 06:38 然后所以他来之后
- 06:41 很多这种 DeepMind 的人都加入了
- 06:43 然后我觉得就是你 pitch 到这个 direction 之后
- 06:46 就能吸引到很多
- 06:48 就现在最近也加了很多 DeepMind 的人
- 06:50 就可能这个东西对他们来讲更有意思
- 06:53 然后他们在大公司里如果工作不愉快
- 06:57 就会找这种类似的公司
- 06:59 然后第二个就是这个故事就好讲
- 07:02 因为比如说你说我们要做这个
- 07:04 美国的 DeepSeek 什么
- 07:06 就 literally 我们的 CEO 在跟我们年会
- 07:10 或者是在外面
- 07:11 你看他们的报道就是什么
- 07:13 这个白宫邀请
- 07:14 因为说
- 07:16 这个美国在这上面没有
- 07:18 所以这企业都不敢用中国的
- 07:20 因为因为就是那种 privacy concern
- 07:23 就是不管它实际上怎么样吧
- 07:26 但是他这个故事就好讲
- 07:28 好讲之后钱就好拿
- 07:29 然后所以就我觉得
- 07:31 反正是一个方向上的大大转变
- 07:35 然后所以一方面
- 07:38 就是你很难知道
- 07:39 这个创业公司
- 07:40 它现在做这个
- 07:40 它之后会不会改变什么东西
- 07:43 就感觉跟 Meta 内部转组
- 07:45 的这个稳定性很不一样
- 07:47 然后第二就是
- 07:48 你不知道里面的人
- 07:50 当初我找了大半年
- 07:52 就是我这个过程
- 07:54 就因为我觉得
- 07:55 我不太确定
- 07:56 这个是这些公司
- 07:58 首先它
- 07:59 它适不适合我加入
- 08:01 就是我加入之后
- 08:02 我能不能跟这些人
- 08:03 相处到一块
- 08:04 因为很多人
- 08:05 他如果是这个
- 08:07 叫什么 stealth mode
- 08:09 我不知道中文叫什么
- 08:11 就是还没有公开的那种
- 08:12 对秘密模式
- 08:13 对对对
- 08:14 你就很难在那种网上
- 08:17 公开找到他们很多人的这种信息
- 08:19 我都是从领英(LinkedIn)上看
- 08:21 然后领英
- 08:22 你就只能看他们的专业背景
- 08:24 所以这是一方面
- 08:26 然后另一方面就是
- 08:27 他们做
- 08:29 就是实际上工作这种文化呀
- 08:32 氛围呀
- 08:33 都很难去
- 08:34 你不太清楚
- 08:35 但是 Meta 的话
- 08:36 你就大致了解
- 08:37 因为你在内部已经工作过一段时间
- 08:40 所以我觉得这就是一个是人
- 08:43 人的背景
- 08:45 另一个就是他做东西的方向
- 08:46 还有他文化这种氛围
- 08:49 都不是很了解的情况下
- 08:51 要做一些选择
- 08:53 还是挺
- 08:54 就是需要担挺大的风险的
- 08:59 然后我当初的一些策略就是
- 09:01 因为我当初就
- 09:04 在我想的时候
- 09:06 我觉得 Meta
- 09:07 我已经不是特别想待了
- 09:09 就是在这种大公司
- 09:11 我觉得我看不到
- 09:12 我以后的成长空间
- 09:14 我不太适合这种环境
- 09:16 所以我只看这个创业公司
- 09:18 所以我当时的策略
- 09:19 就我觉得跟很多人一样
- 09:21 就是一个是看他的 VC Back
- 09:23 就是谁投了他们的钱
- 09:25 然后如果这些人投的话
- 09:28 他们肯定要比你懂得多
- 09:30 就是虽然投资人有很多的钱
- 09:32 然后现在烧钱也很快
- 09:34 但是这些比较知名的 VC
- 09:37 他们肯定还要是有一套流程
- 09:39 来验证那些人是
- 09:42 最起码是合格的
- 09:44 它会刷掉一批
- 09:45 就是比如说有的做套壳公司之类的
- 09:48 然后第二点就是我会去
- 09:50 当然我肯定是要看
- 09:53 这些公司做的产品
- 09:54 是我想做的
- 09:55 比如说当初 Coding Agent
- 09:56 我比较感兴趣
- 09:57 还有一些就是 AR VR 的东西
- 09:59 有一个公司叫做 Sesame.ai
- 10:02 就是他们做那个很逼真的这种语音生成
- 10:06 我当初就跟他们聊
- 10:08 我二月的时候就有朋友跟我发
- 10:10 因为他知道我在找工作
- 10:11 然后我一看我说
- 10:12 这公司在纽约
- 10:14 然后让我跟他们联系一下
- 10:15 然后就去他们 office 跟他们人聊了一下
- 10:18 但是第二周我就发现
- 10:20 那个人就被我们 Meta 挖过来
- 10:23 就是是那一波什么百亿补贴的
- 10:27 其实我当时你还跟我说
- 10:29 我说当时你都说
- 10:30 你都很在考虑这个公司
- 10:32 结果突然发现
- 10:33 那个人又被挖回来了
- 10:34 对那个人是之前
- 10:35 Google 的 VP
- 10:37 然后做 research 那一套模型
- 10:40 都是带出来的
- 10:40 所以他们一走
- 10:41 我就一个方向是
- 10:42 我就不知道
- 10:44 这个公司继续会怎么样
- 10:46 然后另一个
- 10:47 是我刚跟那个人聊
- 10:49 聊的还挺好的
- 10:50 他说他很讨厌
- 10:51 这个大公司
- 10:52 这种什么 change time
- 10:54 他很 enjoy 小公司
- 10:56 然后他觉得很多
- 10:57 这种愿景都跟我讲
- 10:58 然后结果
- 10:59 结果第二个星期就过来了
- 11:01 我就觉得还是 money talks
- 11:04 就是感觉他并没有很正儿八经的
- 11:07 就我就觉得人员变动
- 11:10 还不像大公司那样 attach
- 11:14 因为可能小公司
- 11:17 本来就靠这几个人
- 11:18 然后如果这几个人一走
- 11:20 你的这个方差或者质量
- 11:22 就会变得很快
- 11:23 所以但是那个公司也没要我
- 11:27 就是我投了
- 11:27 我觉得他们想找一些
- 11:29 这种专门做语音生成的背景的人
- 11:32 然后我做的是交互
- 11:33 他们做那个眼镜的
- 11:34 那个阶段还没有到
- 11:35 所以就没找我
- 11:37 然后这是一个我挺想去的
- 11:40 然后对
- 11:42 然后除了看 VC 背景
- 11:44 然后我另一个方式
- 11:45 就是在 LinkedIn 上去搜
- 11:47 搜那些在职员工
- 11:49 然后就一个一个看
- 11:51 因为比如说有一次是
- 11:53 Windsurf
- 11:54 他们的那个 recruiter
- 11:56 Richard
- 11:56 说你要不要来
- 11:58 然后我说
- 11:59 coding assistant
- 12:01 虽然我没用过 Windsurf
- 12:02 但是我听过他们名字
- 12:03 我说可以试一下
- 12:04 然后我去 Windsurf
- 12:05 看了一下
- 12:06 感觉好多都是老印
- 12:09 虽然我觉得
- 12:10 我觉得就是没有什么
- 12:12 没有什么
- 12:15 就我觉得还是偏见吧
- 12:18 就是感觉老印多的地方
- 12:19 我就首先文化上
- 12:21 就感觉合不来
- 12:22 然后所以我就
- 12:24 就会看一些这种
- 12:25 当初我知道这个
- 12:27 reflection.ai
- 12:28 他们是因为一个同事也在投
- 12:32 然后他跟我分享
- 12:33 然后我一看我说
- 12:34 哇首先这个人很厉害
- 12:36 就是你看之前的人是 DeepMind 出来的
- 12:38 然后又做 AlphaGo 的
- 12:40 我觉得这应该是很 solid
- 12:41 然后我就去 LinkedIn
- 12:43 看他们的这些员工早期的
- 12:45 然后感觉大家背景也比较 diverse
- 12:49 就不是只是一个国家
- 12:51 或者是不是只是一个学校之类的
- 12:54 因为我觉得那样的话很容易
- 12:55 就很容易融不进去
- 12:58 所以我当时看完之后
- 13:02 我就觉得可以
- 13:03 然后我的方式
- 13:05 我觉得目前我的方式
- 13:07 比较成功的是
- 13:08 直接 reach out
- 13:09 而不是
- 13:10 就是我会去投
- 13:12 他们的那个
- 13:13 网页上的直接的
- 13:15 它叫什么 inbound
- 13:16 就是你直接申简历
- 13:18 但是我觉得
- 13:19 一个更有效的方式是
- 13:20 首先最好这个公司
- 13:23 在你家附近
- 13:23 或者是就在你这个城市
- 13:25 这样的话有更多的几率
- 13:26 你可以邀请那些员工
- 13:28 就随便喝个咖啡之类的
- 13:30 然后我就在那个 LinkedIn 里面找
- 13:32 因为我觉得
- 13:32 我先讲
- 13:35 就是我在那个 LinkedIn 找
- 13:37 找那些在这个公司的人
- 13:39 然后我就一个一个地去跟他们发
- 13:41 就是我先看他们级别是不是很高
- 13:44 或者是这个做的东西跟我相不相关
- 13:47 如果做的不相关
- 13:49 或者级别很高
- 13:49 我觉得大概率约不出来
- 13:51 或者约出来也没什么用
- 13:53 就找 CEO 直接约
- 13:55 他肯定不会出来
- 13:56 然后我就找那些
- 13:58 看起来就有做这种 agent research
- 14:02 或者是做这种 infra 的
- 14:03 我就找他
- 14:04 然后就发一个 cold message
- 14:06 就说我现在在 Meta 工作
- 14:08 这个东西
- 14:09 我现在在看公司
- 14:10 然后我觉得你们很有意思
- 14:12 想聊一下
- 14:13 然后我就住在 Williamsburg
- 14:14 在你们公司旁边
- 14:15 有没有时间
- 14:16 然后他们
- 14:18 我觉得那个公司
- 14:19 当初人都特别的 responsive
- 14:22 就是有两三个就直接回来说
- 14:25 啊 anytime
- 14:25 这个然后我当初周末就直接约出来一个
- 14:29 里面工作的就是做 infra 的一个人
- 14:33 然后他当初之前是在 Amazon
- 14:36 他相当于是就是前十号的员工
- 14:39 然后我们就就很随意地找一家奶茶店聊了一下
- 14:43 就我我问一下你们公司做什么的
- 14:46 然后你觉得怎么样
- 14:47 然后然后如果我进去的话
- 14:50 你觉得需要什么样的人
- 14:52 然后就相当于了解一下
- 14:54 他们公司怎么样
- 14:55 然后他就非常的热情
- 14:57 而且就
- 14:57 就是你能听出来
- 14:59 他对他们公司做的东西
- 15:01 都就比较
- 15:03 比较有激情
- 15:04 然后我就觉得
- 15:06 这些人都挺不错
- 15:07 然后后续
- 15:07 我又找了一两个人聊
- 15:09 就感觉大家都
- 15:10 还找一个韩国人
- 15:12 韩国人说他在学中文
- 15:13 因为觉得中国以后
- 15:15 是什么科技
- 15:16 就是什么世界的头牌
- 15:19 然后现在在为移民
- 15:22 做准备什么
- 15:22 反正我就觉得他们挺有意思的
- 15:24 然后而且很
- 15:25 就是大家都很年轻
- 15:28 都是那种
- 15:29 二十五六岁
- 15:31 可能在大厂或者别的地方
- 15:33 工作了三四年
- 15:35 然后来这边
- 15:36 就觉得很有活力
- 15:38 然后我聊完就觉得
- 15:39 我可以试一下
- 15:40 所以我觉得拿到这个面试的机会
- 15:45 就我现在拿到
- 15:47 就是我之前面了
- 15:49 可能有四五家
- 15:51 这种创业公司
- 15:52 我拿到机会分两部分
- 15:54 一方面是别人会 reach out
- 15:57 你在 LinkedIn 上或者是哪
- 15:58 然后你如果想去的话
- 16:00 就找猎头
- 16:00 他来帮你 schedule
- 16:02 比如说当时 Windsurf
- 16:04 好像就是这样的
- 16:05 然后另一方面
- 16:07 就是你 reach out 他们
- 16:08 就比如说那个 Sesame
- 16:10 或者是这个 Reflection
- 16:11 就是我直接去找他们 LinkedIn
- 16:14 然后冷不丁的
- 16:15 哪一个就会邀请你
- 16:17 到他们办公室坐坐
- 16:18 然后如果坐坐
- 16:19 其实他们就是对你感兴趣了
- 16:22 然后如果聊完
- 16:23 会发现他们需要
- 16:24 或者是刚好有你的职位的话,基本上都可以进面试。我觉得这个对我来说比较有效。
- 16:36 那你面试的那我看你说这个其实挺挺有意思的
- 16:39 就是我忘了之前反正有一个
- 16:42 之前我一个之前的实习生也要问我
- 16:43 这种找 startup 怎么弄的
- 16:46 其实跟当时我们讨论很多点非常的像
- 16:48 就是你自己投很多
- 16:51 同时也去找人这种 LinkedIn 要找啊
- 16:54 或者是这种 cold email 什么的
- 16:56 对
- 16:57 对
- 16:57 然后那你现在进入面试之后
- 17:00 那面试的话
- 17:00 也是就是也是一面 coding 吗
- 17:02 还是说别的不一样的方式
- 17:04 对这个面试
- 17:05 我其实准备挺久的
- 17:06 一开始
- 17:07 嗯
- 17:08 我觉得今年整个找工作的时候
- 17:11 我都很有点焦虑
- 17:13 因为我觉得
- 17:14 我不确定
- 17:15 我觉得我 eventually 会找到一个公司
- 17:18 如果一直找
- 17:19 但是我不确定什么时候能找到
- 17:21 所以我就
- 17:22 我觉得我很难静下来
- 17:24 去准备那些什么 LeetCode
- 17:26 然后包括现在 LeetCode
- 17:28 都直接 vibe code
- 17:29 我觉得不 make sense
- 17:31 再准备那些
- 17:31 或者是
- 17:32 尤其是初创公司
- 17:35 你很难确定
- 17:36 他们到底面试的 style 是什么
- 17:39 所以其实一开始的话
- 17:42 我在准备的时候
- 17:46 花了差不多两个月
- 17:47 从五月开始
- 17:48 我很正式地制定了一些计划
- 17:50 一方面还是代码的熟悉度
- 17:52 就是刷 LeetCode
- 17:54 但是不是说每天都刷之类的
- 17:56 就是说每天今天上班了
- 17:58 然后工作也不是很忙的时候
- 18:00 可能看一到两道题
- 18:01 然后想五分钟
- 18:03 然后再看一下它怎么解的
- 18:04 我觉得就是基本功摸一下吧
- 18:08 然后第二个就是
- 18:10 我看了很多 paper
- 18:12 就是我觉得如果我想面试这个方向
- 18:15 那我需要对这个方向熟悉
- 18:16 我觉得比较幸运的是
- 18:19 我当时在 Meta 工作的时候
- 18:20 就涉及到了很多这种
- 18:23 做 agent 的 development
- 18:24 然后做一些 post training
- 18:25 做一些 data collection 之类的
- 18:27 所以我其实
- 18:28 有一些重合了
- 18:30 跟我想做的
- 18:31 但是我不太清楚
- 18:33 除了我做这个细方向
- 18:34 整个领域的
- 18:35 所以我就制定了很多这种计划
- 18:38 比如说当时我觉得那个
- 18:40 就是那个做 LLM 的人
- 18:43 他经常在 YouTube 上
- 18:45 po 东西
- 18:46 Andrej Karpathy
- 18:47 对对对
- 18:48 我觉得他真的特别的特别的好
- 18:51 我看了好多 video
- 18:52 我感觉他说了很多
- 18:52 就是他解释得特别清晰
- 18:54 浅显易懂
- 18:54 对真的
- 18:55 我觉得这样的人
- 18:57 才是真正懂
- 18:58 反正我就看了
- 19:00 你要考虑去他的 startup
- 19:01 他不有个
- 19:01 有个什么 startup
- 19:02 他 startup 是做 education 的
- 19:04 我记得
- 19:05 对是
- 19:06 而且就是还没有什么
- 19:07 特别多的信息可以找到
- 19:08 所以
- 19:08 对
- 19:09 我觉得现在还没有考虑到 education
- 19:13 但是反正我就看了他很多内容
- 19:15 就
- 19:16 我觉得很深入浅出
- 19:19 然后另外也是整理了很多这种 paper
- 19:22 就是比如说让 Claude 帮我
- 19:24 我当时跟 Claude 聊好多
- 19:26 就是我要准备什么面试
- 19:28 帮我准备梳理一下这几年的发展
- 19:31 给我一些好的 paper
- 19:32 然后我通过一些 paper
- 19:33 包括我自己听到的
- 19:35 我都去看一下
- 19:36 就对这个领域有一些了解
- 19:38 这是另一方面
- 19:40 然后具体的就是这些面试的准备
- 19:45 我觉得很难
- 19:46 因为它没有那么的八股
- 19:48 就是不会是像面大公司一样
- 19:51 你知道整个流程
- 19:52 所以我更多的就是
- 19:54 我觉得主要我就 focus 在这两个方面
- 19:58 就是专业知识的这种熟悉
- 20:00 跟这个基本 coding 技能的这种熟练
- 20:05 因为我在
- 20:07 我其实很
- 20:09 这半年在一月的时候
- 20:11 我就开始找这些 startup
- 20:13 然后那个时候我的想法是
- 20:16 顺其自然
- 20:17 就跟 dating 一样
- 20:18 就是这个人合适
- 20:21 那就肯定是可以继续
- 20:23 不需要你准备什么
- 20:24 然后没有管太多
- 20:27 就是如果有人 reach out
- 20:29 我感兴趣
- 20:29 我就说那就开始聊
- 20:30 然后那个时候
- 20:31 有一些国内的公司
- 20:33 比如说我记得
- 20:34 那个做机器人的
- 20:37 他们想 reach out
- 20:38 因为他们看我们之前
- 20:41 做那个 EMG 的手环
- 20:42 然后他们会有一些就想
- 20:44 我们可以用这个 EMG 来控制
- 20:47 然后找一些这种 Meta Reality Lab 的人
- 20:50 然后那时候聊的时候
- 20:51 很多都只是这种 vibe check
- 20:53 就是他们就跟你聊一下
- 20:55 你的经历什么的
- 20:56 而且我觉得很多时候
- 20:58 你跟国内公司
- 20:59 包括我跟我同事交流也是
- 21:01 他们就会套话
- 21:02 就是他们其实并不是真的
- 21:04 对你这个人特别特别感兴趣
- 21:07 但他们对你这个技术感兴趣
- 21:09 就比如说我同事说
- 21:11 他们做 Llama
- 21:12 有一个他做 Llama 语音
- 21:14 然后他就说
- 21:16 这个在跟
- 21:17 那个米哈游面试的时候
- 21:21 就是什么
- 21:22 别人就会套话
- 21:23 就会说
- 21:24 你们这个技术怎么做的
- 21:26 你知不知道那个技术
- 21:27 然后他就觉得很烦
- 21:30 就觉得
- 21:30 就不是说真心想要他
- 21:32 而是说就是
- 21:33 有一种这种
- 21:35 就相当于是通过这种来
- 21:41 来刺探
- 21:41 套取的感觉
- 21:42 套取技术上的一些细节
- 21:44 反正这也是一种面试模式吧
- 21:46 另一种面试模式就是
- 21:47 我面那些公司一开始的时候
- 21:50 他们就是说
- 21:51 他们想在北美发展一个
- 21:53 比如说 research center
- 21:54 然后现在在招一批新的人
- 21:57 然后就问想不想
- 22:00 比如说有
- 22:01 当时有一个公司就说
- 22:02 你想不想来做这个 director
- 22:04 我说啊
- 22:05 我天
- 22:06 我说我才工作了三年
- 22:08 我这个能力
- 22:10 我觉得我不太够
- 22:12 而且我觉得我
- 22:13 我还是想在技术上发展更多的
- 22:16 就时候还没到之类的
- 22:18 反正那个时候就有一些经验
- 22:21 然后后来也面试一些公司
- 22:22 就有一个叫做
- 22:24 Deception Lab
- 22:26 好像他们是做这个 Diffusion LLM 的
- 22:28 还挺厉害的
- 22:30 然后面试的时候
- 22:31 那个也比较随意
- 22:34 但是那个人就直接给我一个 paper
- 22:36 说这个算法
- 22:37 是 linear transformer 的一个东西
- 22:40 就是把那个 paper 的截图给我
- 22:42 说你把这个 formula
- 22:43 给在 PyTorch 上给我实现一下
- 22:46 然后我觉得
- 22:47 我觉得他们
- 22:48 我实现了
- 22:50 但是没有
- 22:50 就是他也不让用
- 22:52 那个 Claude 之类的
- 22:53 所以我实现了
- 22:55 我后来发现写错了
- 22:56 然后另外就是我感觉
- 22:58 我对 PyTorch 其实不是
- 22:59 就我并不是写那种 modeling 的
- 23:02 那种专业
- 23:03 但是我觉得那还挺有意思的
- 23:05 就最起码比那种面八股之类的
- 23:07 有意思的多
- 23:08 所以就是面试的 style 很不一样
- 23:11 有的他就直接让你去写算法
- 23:13 或者挺难的
- 23:15 然后我在这个地方面试的时候
- 23:19 他就让我写一个会下棋的 agent
- 23:21 我觉得就是以前我们上学的时候那种
- 23:26 就我觉得很有意思
- 23:28 就是像解决一个问题一样
- 23:30 而不是说现在有一个 string
- 23:31 你把它怎么给 replace 一下
- 23:34 然后我那时候就是
- 23:35 而且他让你用这个 Claude
- 23:37 他就说你可以跟这个工具一起做
- 23:39 因为我们公司也这样写
- 23:40 然后我就想到我们
- 23:42 其实以前大学的时候
- 23:43 学这个什么人工智能课
- 23:45 写过这种下象
- 23:46 下这种国际象棋的这种 agent
- 23:50 我就直接说
- 23:51 啊跟他说一些
- 23:52 什么蒙特卡罗可不可以啊之类的
- 23:54 反正我觉得挺有意思的
- 23:56 但是当初
- 23:56 我面的时候还特别紧张
- 23:59 因为我觉得
- 24:00 我觉得我不是那种面试机器
- 24:03 就是有的人他面试真的 performance
- 24:05 非常的就是 coding 之类的很强
- 24:08 但是我觉得我更多的
- 24:10 在于就是我会发散
- 24:13 发散地去想
- 24:14 然后但是我的
- 24:15 很多时候写 code 的
- 24:17 我质量可能不是他们那么的强
- 24:20 或者有时候我需要去 Google 很久
- 24:22 所以在这方面
- 24:23 我没有下很大很大的功夫
- 24:26 去专门提高这方面的技能
- 24:29 更多还是专业上的东西
- 24:31 对
- 24:32 我感觉就是
- 24:34 那刚才你说你面的时候
- 24:37 是可以用这种 AI coding
- 24:39 其实我们组最近
- 24:40 我最近也是换组了嘛
- 24:42 然后我跟
- 24:43 你换组了
- 24:44 不知道
- 24:44 专门聊一聊
- 24:46 对之后可能可以专门聊一聊
- 24:48 我这个职业上的一些小转变
- 24:50 但就是今天聊
- 24:52 就是我们这个组要招新的 intern
- 24:53 然后我们新的这个组
- 24:54 是 focus 在这种 research engineering
- 24:57 research prototyping 方面的东西
- 24:59 可能不太 focus 在发 paper
- 25:00 发 paper 如果有
- 25:01 可能是一个就是 nice byproduct
- 25:03 但不是 main focus
- 25:05 focus 可能是要 build
- 25:06 更多的 general experience 这些东西的
- 25:09 然后
- 25:09 然后我们在招 intern 的时候
- 25:11 就发现
- 25:12 跟往年面的过程很不一样
- 25:15 因为我们往年可能
- 25:17 目标是要拼 paper 嘛
- 25:18 所以需要招进来的学生
- 25:20 可能是这种
- 25:22 这种
- 25:23 就可能是一个
- 25:24 要很好的 idea
- 25:26 要很好的 engineering skill
- 25:28 同时要好的 paper writing
- 25:29 整个 sense
- 25:30 要是一个 complete package
- 25:31 但是呢
- 25:32 这跟我们
- 25:33 现在我们组的 focus
- 25:35 有点点不一样
- 25:36 因为我们现在组的
- 25:37 这个 focus 相当于是
- 25:38 我们不太 care paper
- 25:39 那么有些方面的专长
- 25:41 我们可以放一放
- 25:42 我们想要 builder 能力
- 25:46 要无比的强
- 25:47 越强越好
- 25:47 因为这是我们最想弄的
- 25:49 然后我们当时
- 25:50 我就跟我一个组员
- 25:51 然后就在那里聊说
- 25:52 我们怎么样去重新
- 25:55 重新设计
- 25:56 我们这个面试的流程
- 25:57 来使得我们找到
- 25:59 更合适我们的 candidates
- 26:00 然后我们就采取了
- 26:03 一种这种类似于 AI coding 的这种方式
- 26:05 然后这种体验
- 26:07 反正我们面了有几个人了吧
- 26:09 然后我们现在感觉这个模式非常的有意思
- 26:11 因为因为现在至少在我们公司
- 26:13 我不知道所有大公司怎么样
- 26:15 我也不知道
- 26:16 比如我也不知道 Meta 怎么样
- 26:17 但比如我们公司
- 26:17 基本上那种比较拥抱 AI 的
- 26:23 基本全都是 all in Cursor
- 26:25 就是用 Cursor 来扣的各种东西
- 26:26 当然用 Cursor
- 26:27 全部都是 yolo 模式
- 26:28 对的对的对的
- 26:29 用 Cursor 也分很多种这种 spectrum
- 26:32 有的可能是像你说的 YOLO
- 26:33 像我就属于那种比较 YOLO 一点
- 26:35 我也是 YOLO
- 26:36 也就是因为我们写的 repo
- 26:38 也不是 production code base
- 26:39 就是那种 prototyping code base
- 26:40 所以我很多时候
- 26:41 直接就 push 到 main 了
- 26:43 那最近我们还是不 push 到 main 了
- 26:44 因为我们有一些这个
- 26:45 这个 internal customer
- 26:47 我们不能这么这么的 reckless
- 26:49 但是就是我们还是
- 26:51 基本上很多就是
- 26:51 这种 vibe code 这种感觉
- 26:53 然后有的人用 Cursor 比较保守
- 26:54 只是用它的 autocomplete
- 26:55 或者时不时问一个问题
- 26:57 这也可以提高生产力
- 26:58 只不过可能是不一样的这种提高
- 27:00 然后我们把这一样的
- 27:02 一个模式放到面试里面
- 27:03 就发现其实
- 27:03 在学生的角度
- 27:05 还是可以看出
- 27:06 他们对于 AI 工具
- 27:07 不一样的一些经验
- 27:09 有的学生就是
- 27:09 fully embrace
- 27:10 有的学生就可能
- 27:11 稍微保守一点
- 27:12 在 research 里面
- 27:13 这都 make sense
- 27:13 因为 research 我觉得
- 27:14 特别是那种
- 27:16 就是我比较
- 27:18 最近比较 focus
- 27:19 这种 HCI
- 27:19 这种 technical research
- 27:21 coding 不是特别的
- 27:22 一个 bottleneck
- 27:22 就你可能整个 project
- 27:24 coding 的 percentage
- 27:26 我也不知道多少
- 27:26 可能 20% 到 40%
- 27:29 差不多了
- 27:29 其他很多是你的
- 27:30 ideation
- 27:31 你的这种 study
- 27:32 你的这种 paper writing
- 27:33 这是很重要的一部分
- 27:34 所以哪怕你
- 27:36 你不太去利用 Cursor 的这种
- 27:39 服务 capability
- 27:40 你也没有失去什么
- 27:42 但是如果你在一个这种
- 27:43 fully builder mode 的话
- 27:45 其实你就失去了很多
- 27:46 就你没有办法
- 27:47 试很多个 idea
- 27:48 你没有办法很好地
- 27:50 去把一个 idea
- 27:51 execute 到极致什么的
- 27:53 这个是我觉得
- 27:54 你刚才提到面试那点
- 27:57 让我想到就是说
- 27:58 如果未来我
- 27:59 我如果去换工作面试
- 28:01 我也会感觉说
- 28:02 那个公司
- 28:04 它如果能够
- 28:05 embrace AI coding interview
- 28:06 我觉得是对我
- 28:08 从一个面试者角度
- 28:09 我觉得是加分的
- 28:10 因为我认为
- 28:10 觉得这个公司
- 28:11 它是比较 forward looking
- 28:12 而不是还在那里
- 28:13 什么什么
- 28:14 reverse the string
- 28:16 或者什么
- 28:16 two sum three sum
- 28:17 就是问这些
- 28:18 what's the point
- 28:19 what's the point
- 28:20 就是
- 28:20 对对对
- 28:21 abandon
- 28:22 什么
- 28:23 对
- 28:24 就对
- 28:26 所以我是感觉
- 28:27 这以前可能我没有
- 28:30 以前我面试人
- 28:31 没有面过很多 coding
- 28:32 基本上都是偏 research
- 28:34 这种 conversation
- 28:35 这种聊天啊
- 28:36 是有可能最多
- 28:37 share 一下 screen
- 28:38 聊一聊更深入的 research
- 28:39 但很少这种 coding
- 28:42 然后这次学着弄 coding
- 28:43 我感觉还是挺有意思的
- 28:44 对
- 28:44 对我觉得
- 28:46 尤其是
- 28:49 对于你的面试职位
- 28:52 其实有很多地方
- 28:53 它并不需要
- 28:54 就是它 coding 的能力
- 28:57 就这些解题能力
- 28:59 它跟你最后工作的这种
- 29:01 实际上用的能力
- 29:02 很不 align 的时候
- 29:03 我觉得面那种什么
- 29:05 two-sum three-sum
- 29:06 或者是 difficult
- 29:08 就更没有
- 29:09 这如果说比如在
- 29:10 two-sum three-sum 它刚出来的那
- 29:12 比如说前一两年
- 29:13 我觉得其实有一点点 value
- 29:15 因为它可以考一个
- 29:16 怎么去思考这个问题
- 29:17 然后去实现什么
- 29:19 但现在首先
- 29:20 面试里面问
- 29:21 two-sum three-sum 的几率太低了
- 29:22 大家都直接问
- 29:23 是 medium 或者 hard 的问题了
- 29:24 然后你直接问 hard 的问题
- 29:26 我自己的感觉
- 29:27 就如果我看了个 hard 的问题
- 29:29 然后我之前没有准备的话
- 29:30 我不可能在面试给的时间里面答出来的
- 29:32 我记得什么
- 29:33 我忘了具体的什么
- 29:34 Meta 还是 Google
- 29:35 反正这种大公司是
- 29:36 40 还是 45 分钟要答两道 hard 的题
- 29:39 就是如果要 staff 或者 senior staff 的 level
- 29:41 这就不可能啊
- 29:42 就是你如果没有准备过
- 29:43 而且我觉得
- 29:44 当你是 staff 的时候
- 29:46 你很少去真的做这些东西了
- 29:49 一般这些都是三或者四级
- 29:51 就是刚刚进去的时候
- 29:52 我觉得因为很多 staff
- 29:54 他可能更多的是做这种...
- 29:57 我觉得是写 Doc
- 29:58 写 Doc
- 29:59 然后对
- 29:59 写 architecture
- 30:01 写这种东西的
- 30:02 对对对
- 30:02 很多 staff
- 30:03 他根本一年不碰代码的
- 30:05 你让他去面
- 30:07 怎么能面到
- 30:08 所以
- 30:09 anyway
- 30:11 反正我现在
- 30:11 就是我觉得创业公司
- 30:15 首先一个是他面你
- 30:18 你也得面他
- 30:19 就有的你面试一过来
- 30:21 我就不想去面
- 30:22 就比如说 Cursor
- 30:22 Cursor 我当时投
- 30:24 投完之后
- 30:25 他直接给我发了一个
- 30:26 automatic email 说
- 30:29 好欢迎你投
- 30:30 这是我们的这个 screening 题目
- 30:33 take home challenge
- 30:34 你第二天到什么时候提交
- 30:37 我说拉倒吧
- 30:38 我现在我自己
- 30:41 就是我自己的东西还没做完
- 30:43 我现在面试呢
- 30:44 你先用个这种
- 30:46 就是什么 project 来筛我
- 30:48 那显然就是
- 30:49 我觉得不够不够有诚意
- 30:53 而且他们那个就非常的
- 30:55 automatic
- 30:56 就我觉得
- 30:57 不值得我花那么的精力去
- 30:59 就如果有这种东西的话
- 31:01 当我觉得当初
- 31:02 我在去年找的时候
- 31:04 也有一些工作
- 31:05 就是 recruiter reach out 说 OK
- 31:07 这是一个什么
- 31:08 我们要做的东西
- 31:10 你在下周一点开
- 31:12 它就开始计时
- 31:13 第二天给我
- 31:14 然后我就点开
- 31:15 我就没有做
- 31:16 我这种东西就
- 31:19 就投入产出不是正比
- 31:21 就是你就算花很多东西去做了
- 31:24 你都不知道对面有没有人在看
- 31:26 对对对
- 31:27 或者你不确定他在做什么
- 31:29 所以我觉得没有必要去这种
- 31:31 然后我觉得如果真是这样的话
- 31:33 那他们的模式估计还是一个 backdoor 模式
- 31:36 就是我们几个创始人很亲
- 31:38 所以我们一定要招 high quality 的这种人
- 31:41 然后他们用一种 imagination 的东西去想
- 31:44 想怎么拦截
- 31:46 但是真正进去的可能还是通过熟人之类的
- 31:49 所以我觉得这种就不值得去花我的时间
- 31:52 对
- 31:53 对
- 31:54 对
- 31:54 对
- 31:56 make sense
- 31:57 然后我其实有几个问题
- 31:58 刚才反正我一直有点在
- 32:00 你刚才说了很多有意思的点
- 32:01 然后我一直在
- 32:02 在想说什么好的问题可以问的
- 32:04 其实有一个就是
- 32:05 你刚才提到了
- 32:06 你面的时候这公司 coding
- 32:07 我记得我们暑假那会
- 32:08 你刚拿 offer 的时候
- 32:09 你来西雅图
- 32:10 我们
- 32:11 我们吃饭的时候
- 32:12 你就说了
- 32:13 你去了一个 coding interview company
- 32:14 然后
- 32:15 然后之后其实有很多
- 32:16 业界方面的变化
- 32:18 比如说这个
- 32:19 某公司要买 Cursor 没买成
- 32:21 然后
- 32:22 然后他们要买 Windsurf
- 32:23 然后又没买成
- 32:24 然后被 Google 买掉了什么的
- 32:25 那刚刚你提到 Windsurf
- 32:26 所以我刚刚想到
- 32:27 这个如果你当时比如加入了 Windsurf
- 32:29 或者面了 Windsurf
- 32:30 没有被他们这个文化所被吓到的话
- 32:32 为什么会幸好没加入
- 32:33 因为他们当初不是加入之后
- 32:37 只收了几个人去 code
- 32:40 就是只收了一些那个
- 32:42 据说了这都是传言
- 32:43 据说他们反正也让那个 employee
- 32:45 拿到了一些这个该拿到的钱吧
- 32:47 反正我也不知道
- 32:48 但我觉得就是
- 32:50 如果我是真的想做一个东西
- 32:52 然后加入
- 32:53 但是遇到这些
- 32:54 我觉得应该...
- 32:55 是我懂你的意思。那你当时说的时候你想做这种 coding 的吗?然后像我刚才你说道什么 reflection AI,我刚才来 Google 搜的说它 10 月份拿了 2 billion 的这个投资。
- 33:08 2 billion 就 20 亿美元
- 33:10 所以是很多很多钱的
- 33:11 然后所以因为拿了这个钱
- 33:13 所以他们不得不把自己的 vision 变大嘛
- 33:15 你 coding agent 已经远了两个级别
- 33:17 不是两方面吧
- 33:18 对就是相当于他们想扩大规模
- 33:22 像一起的
- 33:24 对然后你现在
- 33:25 跟你当时面的这个 vision 又不一样了
- 33:28 那你是怎么看这个事情的呢
- 33:30 我觉得我跟他们的公司
- 33:32 我跟他们公司也很多人聊
- 33:34 就是我
- 33:35 我首先第一个周
- 33:37 我就是把所有人
- 33:38 我说这才 70 个人
- 33:40 估计聊不完
- 33:41 但是我最起码
- 33:41 我可以聊一聊跟我相关
- 33:42 然后就 schedule 很多 1-on-1
- 33:44 然后我就问你怎么看这个转变
- 33:46 就我觉得大家整体
- 33:48 都是挺拥抱的
- 33:49 因为首先这个 task
- 33:51 它不是说完全不一样了
- 33:53 它只是说之前这个更 focus on post-training
- 33:57 然后更多是这个 coding task
- 33:59 然后现在转变成一个 super set
- 34:02 就是也包括了 pre-training 或者 mid-training
- 34:05 然后另外不只是 coding task
- 34:07 也有很多其他的 agent capability
- 34:09 所以感觉一方面就是大家觉得都觉得很 exciting
- 34:12 就比如说本来你只是造这个火箭的发射器
- 34:15 但是现在你改造这个火箭了
- 34:17 然后另外一个就是
- 34:19 我觉得很
- 34:21 就是我当初面的
- 34:22 这个 agentic researcher
- 34:24 我现在加入的
- 34:25 也是他们这个 post-training 的
- 34:26 这种 reinforcement learning 的 group
- 34:29 所以跟我之前做的是相关的
- 34:32 就并不需要我做很多
- 34:34 方向上的 change
- 34:35 因为是个 super set 吧
- 34:37 所以我觉得
- 34:38 比如公司可能
- 34:39 比如说新招的人
- 34:40 可能跟以前的不太一样了
- 34:41 新招的人
- 34:42 可能更多很可能...
- 34:43 mid-training pre-training 的人
- 34:44 exactly
- 34:45 所以我的整体感觉
- 34:48 就是大家更兴奋了
- 34:49 然后大家
- 34:50 融资融资不就开了
- 34:52 现金流转上涨不就好吗
- 34:54 然后做东西
- 34:55 其实大家也没有觉得就不想做了
- 34:58 而是说就是更...
- 34:59 因为我说 super set
- 35:01 就相当于有更大的机会
- 35:04 但是我觉得主要的 concern
- 35:06 就是能不能做出来
- 35:07 因为就是内部设置的这些 timeline
- 35:11 也都很 aggressive
- 35:13 因为就是我觉得为了投资
- 35:15 投资方也要看到这个答卷
- 35:18 因为我们之前做这个 coding 的东西的时候
- 35:21 没有自己的模型
- 35:23 所以你相当于要在几个月内出来一个大的模型
- 35:27 所以大家都
- 35:28 首先大家都很兴奋
- 35:30 然后我觉得大家加入的这些人
- 35:32 就是 exactly 跟你说一样
- 35:34 后来加入的人全部都是具有这种背景的
- 35:37 或者比如什么 DeepMind
- 35:38 然后我看有这种 OpenAI 出来的
- 35:43 就是更符合这个方向的 taste
- 35:46 然后大家的这个情绪也很高涨
- 35:52 但是就是比较不确定的是
- 35:56 现在没有一个模型
- 35:57 所以就是能不能交出一个满意的答卷
- 35:59 不是很确定
- 36:00 但是我感觉这就是像是创业公司的模型
- 36:03 就是什么东西都不是很确定
- 36:06 但是我觉得这个方向转变还是挺积极的
- 36:10 对我有几些 comments
- 36:13 并不是直接对于 reflection 这个公司的 comments
- 36:17 更多的是更广的
- 36:19 其实我因为我本身不是做 LLM 什么 training 的
- 36:22 就是我其实对这个领域
- 36:23 自己没有什么 hands-on 的经验
- 36:25 我更多的是一个就是用这个东西
- 36:27 在我工作中啊
- 36:28 在我这种生活中
- 36:29 然后我是听很多播客呀
- 36:33 或者说看很多最近的进展
- 36:35 就觉得说
- 36:36 今年最大的赢家我感觉是 Gemini
- 36:40 因为它在年初的时候
- 36:42 其实并不被大家看好
- 36:43 因为它很多方面落后
- 36:44 然后这一年无论是 imaging model
- 36:46 就是 Imagen 或者什么之类
- 36:48 和 Veo
- 36:50 Veo 2, Veo 3, Veo 3.1
- 36:52 然后 Gemini, Gemini 2, Gemini 3
- 36:54 这都是基本上都是顶尖了
- 36:57 就是应该就是第一
- 36:57 number one 的 model
- 36:58 没有之一
- 36:59 然后可能别人在那个刷榜上面
- 37:01 可能比它超过一点
- 37:02 可是在日常的使用当中
- 37:03 我觉得是绝对没有超过这三个 model 的
- 37:07 对
- 37:07 然后呢
- 37:08 我觉得想说
- 37:10 比这种 LLM 啊
- 37:13 比这种 large vision model 啊
- 37:15 或者这种 generic model
- 37:16 foundation model
- 37:16 到底比的是什么
- 37:17 然后我现在感觉
- 37:19 其实 boils down to 一些...
- 37:22 其实这个很
- 37:22 这个 formula 也非常的简单
- 37:24 也不是我什么独创的
- 37:25 只是就是我可能
- 37:26 最近我在想
- 37:27 为什么 Gemini team 能够赢
- 37:29 其实可能
- 37:30 就是 infrastructure 要好
- 37:33 你这叫 infrastructure
- 37:34 因为你要 train 这么大的 model
- 37:35 其实我也不知道多少个 node
- 37:36 可能千 node 万 node 什么十万
- 37:38 就更多的 node
- 37:39 然后就是这种 node
- 37:40 你就不能够拼一堆这种什么简简单单
- 37:45 这个草台班子搭出来的 infra
- 37:47 指望它能够全世界一流
- 37:48 这是非常难的一个事情
- 37:49 然后这也是我觉得
- 37:51 这也是我觉得为什么
- 37:54 比如说
- 37:56 比如说很多大厂看起来还可以
- 38:00 但不能够持续推出更好的 model
- 38:03 因为可能它那个 infrastructure
- 38:05 在这个 iteration work 了
- 38:06 但是下个 iteration 有一些大的改变
- 38:08 无论是从单模态到多模态的改变
- 38:10 或者说从数量级别
- 38:11 又增加了两个数量级别的数据的话
- 38:13 因为它有多模态了嘛
- 38:15 所以可能可以 inject audio
- 38:16 inject video
- 38:17 可以 inject whatever thing
- 38:18 它的 infrastructure 不能 support
- 38:20 所以他们跟进不了
- 38:21 作为 infrastructure
- 38:22 Google 应该在我理解当中
- 38:24 应该是所有公司里面
- 38:25 应该是最好的
- 38:26 因为整个是 engineering 里的一个 culture
- 38:28 然后第二个就是 data
- 38:31 Google 它就有无限的
- 38:32 基本无限的 data
- 38:33 它有 YouTube
- 38:34 给它那么多的 video data
- 38:35 然后有那么多 Google Doc
- 38:37 什么 Gmail 各种各种
- 38:40 对但这个东西他不一定会用
- 38:42 可能他们会用员工内部的
- 38:44 怎么样没有没有
- 38:45 Veo 3 绝对用了巨多 YouTube data
- 38:47 因为很多 YouTuber 都已经...
- 38:49 比如说你在那里面打一个什么
- 38:50 Give me a thumbnail of a tech YouTuber
- 38:53 然后他直接给你就是 MKBHD
- 38:55 就那个那个 tech reviewer
- 38:56 就是 obviously 他们用了 YouTube data
- 38:58 他们可能不会承认了
- 39:00 但是但是我们这种明眼人
- 39:02 一看就知道你肯定是
- 39:03 对对对
- 39:04 对
- 39:05 对
- 39:05 那可能
- 39:07 比如他们可能会筛选
- 39:08 他们可能用 high quality YouTube video
- 39:09 他们不会用那种 crappy 的
- 39:11 对吧
- 39:11 他们可能会
- 39:12 只是会选那种头部 YouTuber 来 train
- 39:13 对
- 39:14 然后等于说
- 39:15 我们说了 infrastructure 和 data
- 39:17 然后
- 39:18 其实有了这两个之后
- 39:20 除非模型上有什么
- 39:22 质的改变
- 39:23 那我觉得其实对算法上
- 39:25 这几年没有什么质的飞跃
- 39:26 都是这一块那里补补
- 39:28 当然都一直在提升
- 39:29 但是没有那种
- 39:30 整个
- 39:31 比如 OpenAI 知道的东西
- 39:32 Google 不知道的
- 39:33 这个没有
- 39:33 因为这边人员流动
- 39:34 太太太频繁了
- 39:35 所以基本上
- 39:36 一个地方发明了之后
- 39:38 马上就被挖走
- 39:38 大家知识上
- 39:40 基本上没有很大的 barrier
- 39:41 肯定有
- 39:42 但也没有很大
- 39:43 然后那我说第三个
- 39:44 可能就是就是人才了
- 39:45 因为人员可以流动
- 39:46 就是人才
- 39:46 Google 他因为他
- 39:47 我感觉他已经
- 39:49 至少他从可能去年到今年
- 39:51 他慢慢进入一个良性的 cycle
- 39:52 就是他因为他模型好
- 39:55 因为 infra 好
- 39:55 因为 data 好
- 39:56 所以他能够招到新的人
- 39:58 和保住以前的人
- 39:59 而不像很多比如 Meta
- 40:01 我听说
- 40:01 我听说我也不知道
- 40:02 我在 Meta 其实
- 40:03 在那个什么
- 40:04 什么 super intentional 那个 group
- 40:05 其实不认识太多人
- 40:06 但也看到有些人
- 40:07 陆陆续续地去离职啊什么的
- 40:09 我感觉
- 40:10 Gemini 可能也有离职
- 40:11 但是离职的原因
- 40:11 不太一样
- 40:12 可能 Gemini 离职的人
- 40:13 是是是
- 40:13 比如说想要去
- 40:14 做自己的更大的东西
- 40:16 因为感觉 Gemini 可能
- 40:17 这个这个这个
- 40:18 看到一些瓶颈了
- 40:19 但我感觉可能
- 40:20 Meta 离职
- 40:21 可能更多的是
- 40:21 受不了
- 40:22 感觉 Meta 搞不懂
- 40:23 或者说
- 40:24 我也不知道
- 40:25 或者是他们新的那个什么
- 40:26 Alexandra Wang 不靠谱
- 40:27 我也不知道
- 40:27 这个具体的东西
- 40:28 但就是就我觉得
- 40:29 能够满足 Data、Infra 和源源不断的这种
- 40:34 很好的人才的这个地方
- 40:36 其实不是特别多
- 40:37 我感觉就是 Google 可能是
- 40:39 可能是唯一的一个
- 40:40 对
- 40:42 就是我感觉
- 40:43 就是 long term
- 40:45 除非有什么大的
- 40:46 而且现在他们
- 40:47 他发的 paper 又特别多
- 40:48 如果 paper 多的话
- 40:49 就意味着可能下一个
- 40:50 这种 transformer 的突破点
- 40:51 可能还是在 Google
- 40:52 只是看说 Google
- 40:53 它这次会不会错过
- 40:54 上次他们错过了
- 40:54 上次他们等于说
- 40:55 让给了 OpenAI
- 40:56 然后结果现在又花了
- 40:58 他 2022 年底公布的 GPT
- 41:00 然后花了两年
- 41:02 多一点点时间才追上这个东西
- 41:05 如果他们能够吸取教训
- 41:07 在下一次他们自己
- 41:08 发生这种很好的 research paper 的时候
- 41:11 能够把它即时变成一个产品的话
- 41:13 或者是产品化的话
- 41:14 我觉得是可能会
- 41:17 无论是从股价呢
- 41:18 还是他们整个这个良性的这种 cycle
- 41:21 更好的这个东西
- 41:23 对我感觉
- 41:25 其实 Google 现在的环境挺好
- 41:28 就是一两年前
- 41:30 大家还在疯狂吐槽
- 41:33 就我在 Google 的朋友都想跳槽
- 41:35 但是其实你看就是他们也是说
- 41:37 他们现在也有硬件
- 41:38 也有这个平台
- 41:40 也有 vertical 的一个 full stack
- 41:42 对对对
- 41:43 所以我觉得是挺...
- 41:45 但是我觉得就是他们的 responsibility
- 41:47 跟你像比如说 Mistral
- 41:51 或者是什么 Claude
- 41:53 但 Claude 我觉得也挺强的
- 41:56 就可能就不太一样
- 41:58 他们更多是这种 frontier 的东西
- 42:00 就是我们怎么去想
- 42:02 我们有余力
- 42:03 我们有这个空间去思考
- 42:05 怎么样去推进
- 42:06 接下来更 frontier 的这种
- 42:09 或者 next generation 的东西
- 42:10 然后但我觉得今年
- 42:13 你刚刚说那个比较大的赢家
- 42:16 我觉得 DeepSeek 也挺厉害的
- 42:18 就是相当于在算法上
- 42:20 他把我不知道其他人
- 42:22 是不是在用这个 GRPO
- 42:25 但是他相当于是独立的发现了
- 42:27 而且他验证了说
- 42:30 我们即使没有那么多的卡
- 42:32 我们照样能训的比这种
- 42:34 闭源的模型
- 42:35 on par 最起码的这种 model
- 42:38 而且我觉得他们的人也不是很多
- 42:40 所以就相当于就说
- 42:42 这个东西不是你美国垄断的
- 42:44 然后这个出来之后
- 42:46 我觉得开源
- 42:47 就是 Llama 没落
- 42:50 Llama 4 还在用什么 DPO
- 42:53 我觉得 DeepSeek 打的最狠的就是 Llama
- 42:54 对它其实
- 42:55 从我的角度
- 42:56 它并没有太明显
- 42:57 因为像你说的闭源 model
- 42:59 DeepSeek 可能像你说的
- 43:00 它跟 Llama 肯定是可以一拼的
- 43:02 但是跟 Gemini 或者跟 GPT-5
- 43:04 这级别还是差的有点大的
- 43:05 对对对
- 43:07 但我觉得就是开源
- 43:08 像它把这个算法公布之后
- 43:10 很多这种开源的模型
- 43:12 也终于可以就是说
- 43:14 我可以站上台面了
- 43:17 就是我可以跟很多这种闭源的
- 43:19 来拼。比如 Qwen 这种
- 43:21 然后还有就是什么
- 43:23 就现在很多这种...
- 43:24 对 Qwen 到现在是好像是
- 43:26 是的确是用的很广
- 43:28 很多我看网上很多人都在用
- 43:30 对对对
- 43:30 所以我的感觉是
- 43:33 就是你时代的这个技术的发展
- 43:36 肯定还是得有一些这种很大的投资公司
- 43:41 那你觉得你觉得...
- 43:42 对就我同意了
- 43:44 就是我同意 DeepSeek 的影响力
- 43:45 我感觉它在中国这个影响力
- 43:48 就它是来自中国的这个 open source
- 43:51 非常好
- 43:52 对我觉得非常的好
- 43:53 然后这也是出于
- 43:55 很多因素吧
- 43:57 比如说一般不是说这种
- 43:59 就是叫什么
- 44:00 领先的玩家
- 44:01 他不需要开源嘛
- 44:02 因为他已经领先了
- 44:03 然后你要 play catch up
- 44:05 他必须要开源
- 44:06 因为他要占领更多的市场
- 44:08 他要争取更多信任
- 44:09 这是这种技术方面
- 44:11 一般是追赶者
- 44:12 一般是需要去开源
- 44:14 然后领先者一般不需要开源
- 44:15 然后第二个就是
- 44:16 可能跟政治因素相关的了
- 44:18 就如果说你是一个闭源了中国的 model
- 44:20 可能在全世界范围内
- 44:21 让大家都 adopt 的几率会低一点点嘛
- 44:23 你现在开源之后的话
- 44:24 大家可以有一个 air gap system
- 44:27 你把那个
- 44:27 你把 model 弄下来
- 44:29 我直接这里跑
- 44:30 就不至少不会有 data 上传给中国的 server
- 44:32 所以这个对于
- 44:34 至少公司内部
- 44:35 如果要 deploy 的话
- 44:36 还是比较容易说服人的
- 44:38 对
- 44:38 那至于 publicly 能不能 deploy
- 44:40 我感觉这可能又是一个 challenge
- 44:42 所以这个
- 44:44 我不太确定这两个因素
- 44:46 在美国能够 replicate
- 44:48 对
- 44:48 我不是 criticize reflection AI 了
- 44:51 我只是说
- 44:51 开源这个事情
- 44:53 因为我之前听说
- 44:54 就 Google 它好像自己有一个什么
- 44:56 开源的 model 叫什么
- 44:58 是叫 Gemma 嘛
- 44:59 对吧
- 44:59 对 Gemma
- 45:00 对然后 Llama 也有
- 45:02 然后 GPT 也有什么 GPT-OSS 之类的
- 45:05 几个的影响
- 45:06 然后 Microsoft
- 45:07 自己也有自己的版本
- 45:08 就这些它影响力都非常非常的小
- 45:11 然后我就在想说
- 45:12 就是 what is wrong with them
- 45:15 就是为什么没有人用那些东西
- 45:16 对这个是我在这里...
- 45:19 对
- 45:20 我的感觉是现在
- 45:21 如果大家用开源的话
- 45:24 会一边倒地用 Qwen
- 45:26 就是千问的模型
- 45:27 因为首先
- 45:29 它 performance 挺好的
- 45:30 另外就是它很容易去训
- 45:33 就是我觉得开源市场
- 45:35 就是你哪个模型 make sense
- 45:37 大家就用什么
- 45:38 而不是说就是
- 45:40 为什么这些公司弄得没人用
- 45:43 因为就是你看
- 45:45 换句话说
- 45:46 是不是说千问它开源的 model
- 45:47 就在所有开源 model
- 45:48 就是最强的
- 45:49 而且最好 deploy 的
- 45:51 它应该是最好 deploy
- 45:53 我只能这样说
- 45:54 就是因为比如说
- 45:55 现在很多千问的模型
- 45:56 你开源去做一些小实验的话
- 45:59 你不需要什么 MoE
- 46:00 或者不需要那么多 B(参数)的
- 46:01 你没有那么多卡
- 46:02 但是它小的模型
- 46:03 就是跑得特别的好
- 46:05 就跟前一段 Mistral 开源了
- 46:06 非常火
- 46:07 它说可以在这个
- 46:09 这个叫什么 Edge Device
- 46:12 就是你的手机
- 46:14 或者是那种小计算
- 46:15 能跑 1B 的模型
- 46:16 那如果你跑得好的话
- 46:18 它其实就是...
- 46:19 那大公司就不会去花时间去做这些东西
- 46:24 然后所以我觉得开源就是这个很好用
- 46:28 首先比如说什么 Llama、Kimi 这些都特别的好
- 46:33 他们在 paper 上表现实际上表现也挺好
- 46:36 但是你就是真正去 train 的时候
- 46:39 或者是去用的时候
- 46:41 就发现要比 Qwen 要麻烦很多
- 46:44 对然后另一方面就我觉得开源这个东西
- 46:49 就先不说 reflection
- 46:52 或者是其他的公司
- 46:53 能不能做到这个头部之类的
- 46:56 但是我觉得
- 46:56 对于我来说
- 46:58 我觉得这对我来说是一个非常好的机会
- 47:00 就是像我有机会来
- 47:02 来进入到这样一个
- 47:05 比如说尖端科技的一个研发的过程中
- 47:10 为什么
- 47:11 这跟开源是两个 orthogonal access
- 47:14 我觉得是
- 47:15 就是你做开源的模型
- 47:17 和你做尖端模型是两个
- 47:19 它可以共同存在
- 47:20 尖端科技不是尖端模型
- 47:22 我觉得开源应该目前没有办法
- 47:25 一下做到特别特别尖端
- 47:27 比闭源还好的
- 47:28 但是我觉得就是在这个领域
- 47:31 想要你在那个漩涡的中心
- 47:33 然后我们现在是一个追赶...
- 47:35 就是我觉得现在很多开源
- 47:37 都是追赶者的姿态
- 47:38 但是你最起码可以在其中
- 47:41 真正做 hands-on 的 work
- 47:43 然后这个东西对我个人来说
- 47:46 我觉得我非常的看重
- 47:48 然后我觉得我的同事
- 47:49 就像你说刚才
- 47:51 就很多 DeepMind 的人
- 47:52 因为创始的那些人都是 DeepMind 出来的
- 47:56 所以我觉得
- 47:57 就是他们有的人
- 47:58 就是做比如说 Diffusion 在 Google 里面
- 48:00 或者做 Gemini 的
- 48:02 然后他们过来的时候
- 48:03 就能给你带来一些比较第一手的
- 48:06 就是为什么他们那种模式成功了
- 48:09 所以他可能看不惯
- 48:11 公司现在做一个东西非常地慢
- 48:15 或者是只能做某个螺丝钉
- 48:17 他就出来做这个小公司
- 48:20 去做他自己想做的事
- 48:21 那我觉得这种东西
- 48:22 这种不仅是这个技术
- 48:24 而是这种模式或者是这种解决问题的一些方式
- 48:31 他如果能散播开来
- 48:33 然后被我观察或者吸收
- 48:35 我觉得也非常的有用
- 48:36 所以而且
- 48:38 to be honest
- 48:39 就是现在公司就是钱多
- 48:41 所以感觉没有什么压力
- 48:42 就是你就可劲干就行了
- 48:45 我觉得真的是特别的忙
- 48:46 我最近都是三四点睡每天
- 48:49 但我觉得不是很可持续
- 48:50 可能就是...
- 48:51 而且我...
- 48:52 你三四点睡是在干嘛呢
- 48:54 是在写 code
- 48:54 是在学东西
- 48:55 是在 debug
- 48:56 都在吧
- 48:58 就是我有一种
- 48:59 我的模式就是
- 49:00 我倾向于把东西都干完再睡
- 49:02 然后我就...
- 49:03 那什么叫干完
- 49:04 就是我今天有一些任务
- 49:07 然后中间...
- 49:08 那谁给你的任务
- 49:09 是你自己定的
- 49:10 还是你们组里给你定的
- 49:11 有一些是我自己定的
- 49:13 有一些是别人给的
- 49:15 那你定任务的时候
- 49:16 你为什么不说定的更多一点
- 49:17 定到你不能睡觉呢
- 49:19 那肯定不行
- 49:20 那直接死掉
- 49:21 你得定一个
- 49:23 根据你之前的经验
- 49:24 定一个你觉得可以完成的
- 49:26 而且我的 tendency 是我本来就是一个夜猫子。当初我在 Meta 第一年也是四五点睡然后十二点起来,因为那个时候我觉得没人打扰我。
- 49:37 然后在这边...
- 49:39 但是我觉得可以再开一期
- 49:43 聊一聊在创业公司的这种经验
- 49:45 因为我现在 onboard 三个月
- 49:47 但是我觉得...
- 49:48 三个星期
- 49:49 对三个星期
- 49:50 感觉像三个月一样
- 49:52 确实
- 49:54 就跟你说
- 49:56 infra 真的太重要了
- 49:58 我觉得我们 infra
- 49:59 我们是有 infra
- 50:02 但是...
- 50:02 所有公司都有 infra
- 50:04 所有公司都有 infra
- 50:05 只是说这 infra 能 support 一个卡 training
- 50:08 还是十个卡 training、一百个、一千个、一万个
- 50:10 对它不只是 training
- 50:11 就很多这种小事情了
- 50:13 对对对
- 50:14 就比如说我从 Meta 来
- 50:15 然后我去看一个数据
- 50:17 我去 investigate 一个这种训练过程中的曲线
- 50:24 或者是我去看这个数据的质量
- 50:28 我都有各种 tool
- 50:30 就是 internal 的 tool 非常成熟
- 50:32 可以让我去非常快地
- 50:34 然后非常高效地直接去看到我想做的东西
- 50:38 然后我想去训模型什么的
- 50:41 也就可能大家都吐槽 MLE(机器学习工程师)
- 50:44 你就是写 config 的或者调参的
- 50:46 但它确实非常的高效
- 50:48 你可以在一天之内迭代好多次
- 50:50 但是你我最近发现就是在这边
- 50:53 首先你就没有 tool
- 50:55 所以很多东西...
- 50:57 所以很多是不是那种大厂出来的
- 50:58 他们就是把自己在大厂的那个工具
- 51:00 再重新 reinvent the wheel 再造一遍
- 51:02 然后就可以搞个 startup 了那个东西
- 51:05 exactly
- 51:07 有东西你就直接去买
- 51:08 所以反正 anyway
- 51:10 我现在经历就是很多时候
- 51:12 你会怀念那些 tool
- 51:14 因为你这边没有 tool
- 51:15 你就想方设法要用各种 hack it away
- 51:18 或者是很花时间写各种
- 51:20 比如要有十个 script 要去 run
- 51:22 不然一个一个 check 之类的
- 51:24 所以我觉得
- 51:25 反正就是一个野蛮地带
- 51:27 就还挺不一样的
- 51:29 就是大家都很有概念
- 51:30 但是还有很多很多东西要做
- 51:32 但是我觉得我比较 enjoy 这种
- 51:36 怎么说
- 51:37 就是 enjoy 有东西可以做的这种感觉
- 51:40 然后有东西可以让我发挥
- 51:42 因为我一开始进来的时候我还...
- 51:43 因为我不是做 AI 出身的
- 51:47 所以我还会 concern 会说
- 51:49 我对这个如果不是特别地了解的话
- 51:52 我不知道该怎么做
- 51:54 或者说我是不是只能成一个这种工具人
- 51:57 就是大家让我做什么我就做什么
- 51:58 但是其实你会发现能做的有很多
- 52:01 对
- 52:02 我对我感觉你有这条 startup 路外也很好
- 52:06 因为我可以透过你了解到很多这种一手的信息
- 52:10 然后分享给大家这么多人听
- 52:12 所以我感觉很好
- 52:12 就我自己是个性就是特别保守的人
- 52:15 就我感觉如果我要去做 startup
- 52:17 那我感觉我得得是这种 founder
- 52:20 我才比较有意思一点
- 52:22 要不然的话还是个打工人
- 52:23 说到底
- 52:24 就比如上面突然从 coding agent pivot 成这种 frontier model
- 52:28 这也不会跟我 consult
- 52:30 然后就发生
- 52:31 如果我喜欢当然好了
- 52:32 但是如果不喜欢我也没办法 push back
- 52:34 包括公司被收购的时候
- 52:36 像你说像 Windsurf 这种就是被收购的时候
- 52:38 其实 founder 对于员工的这个
- 52:41 无论是 compensation 还是未来的去向
- 52:43 都有很大的一个决定权
- 52:45 其实非常看个人
- 52:47 对
- 52:47 所以就很看 founder 那个人
- 52:49 然后我我就感觉到
- 52:50 与其把自己的命丢给那个 founder 的一两个人
- 52:53 那不如自己开始干。这是我的感觉。
- 52:56 然后如果说不干,那我觉得大厂接着打工。
- 52:58 我觉得大厂打工有它的一些优缺点
- 53:00 也都非常明显
- 53:01 但反正听你刚才说的这种 moving fast 的东西
- 53:05 肯定是说到 startup 会给你这种沉浸的感觉更大
- 53:09 但我自己的一个观察就是
- 53:11 这几年因为 LLM 太火了
- 53:15 就是大厂的很多组也都是 596 疯狂干
- 53:19 而且他们也都非常的乱
- 53:22 就是因为不管是 reorg 的乱呢
- 53:24 还是因为 politics 乱什么的
- 53:26 然后他们加班也非常的严重
- 53:28 然后但是他们就我也不知道
- 53:30 反正就我感觉可能
- 53:31 比如说在 Meta 可能真的没有这种能够乱干活的组
- 53:35 但是比如在 Gemini 我知道有好多人都是...
- 53:38 我觉得是这样的
- 53:39 就是你在大厂
- 53:41 现在虽然大家的时间或者是精力可能花的很多
- 53:46 但是一方面就是你在你工作的这个 distribution 中
- 53:51 part of them are in politics
- 53:54 就是你要写 Doc 要 align
- 53:56 要就是哪怕你乱
- 53:57 因为他是大厂,你要做很多这种东西
- 54:00 就你没有办法去完全投入到我真的在做实际的小事
- 54:06 我觉得这很多人会...这些是很多人看中的
- 54:10 然后但是如果比如说就跟我说有的那种 staff
- 54:14 他可能一年不写代码
- 54:15 他每天都在忙这些
- 54:17 那这就是 easy 模式在我看来
- 54:19 就也不是...
- 54:20 就是他对这种实现的东西更不看重
- 54:25 但是你需要更多这种人情世故
- 54:27 或者对公司的这个...待越久你的公司内部经验就越多的这种东西
- 54:34 但是我不是很喜欢这种
- 44:36 而且我觉得当如果我做了几年到那种程度
- 54:41 我需要去跟不同的组来 coordinate、来写这种 proposal 之类的
- 54:46 但是我并没有真正地把我的脚踏在这个代码或者实现的坑里
- 54:51 我就会跟他脱节
- 54:52 然后比如说以后就跟 Llama 一样
- 54:55 我们做 Llama 4 的时候要做什么
- 54:58 要用什么样的算法
- 54:59 可能是我拍板的
- 55:01 但是我不知道做什么
- 55:02 我就随随拍脑门想一个
- 55:04 那就是可能会很...怎么说
- 55:09 就把整个公司这个产品都带垮
- 55:12 反正我觉得这也是我为什么不想在 Meta 待的一个原因
- 55:19 离开 Meta 好像是正确的决定
- 55:21 我离开 Meta 的朋友没有一个是后悔的
- 55:25 我觉得那个 TV Lab 就是那个最新的招那个百亿补贴的
- 55:30 百亿补贴
- 55:32 那些人我也不知道他们做了啥
- 55:35 我就觉得反正他们在 Meta 里也是一个神秘团队
- 55:39 就是他们的 code 什么都不在我们的内部代码库里
- 55:43 嗯
- 55:44 也不知道什么时候能出一个东西
- 55:46 反正我就...嗯
- 55:49 对反正就是我之前是看了
- 55:51 是...应该就是那个
- 55:53 之前 OpenAI 离职的那个 Ilya Sutskever
- 55:57 Ilya
- 55:57 对
- 55:58 她去了什么 SSI
- 55:59 她自己创了一个 SSI 的公司
- 56:01 她发了一个观点,她认为说 LLM 的 scaling law 要撞到一个瓶颈了
- 56:06 然后
- 56:07 她的观点我也不知道对不对
- 56:09 她说就是无论 Gemini 也好还有 GPT-5 也好
- 56:14 都已经明显有一个 scaling 的一个 limit 了
- 56:17 然后他觉得接下来是一个 research 的一个时代
- 56:20 对
- 56:21 所以我觉得说不定这时候加入一个 startup 像 reflection 挺好的
- 56:24 因为你们可以更 agile 更加去适应这个东西
- 56:28 对啊
- 56:30 像 Meta 收购了这些人去了这些人
- 56:32 我不知道多少是那种有 research mindset 还有多少是...
- 56:35 就是挖他过来我觉得就是在 Meta 这个环境里
- 56:39 就算你是一个非常好的 researcher
- 56:41 你也要每半年写一下 PSC
- 56:44 你得去想那个东西
- 56:46 就是你没有时间去就跟 Llama 一样
- 56:49 他们没有时间去做这种 deep exploration
- 56:53 因为他们有 quarterly goal 去要 meet
- 56:57 就比如说你把它刷榜刷榜刷榜,或者是你日活要达到多少
- 57:03 那这些东西很多就是你修修补补才能短期内实现的
- 57:09 你没有办法去通过很多这种 try and fail 去实现
- 57:13 所以我自己的感觉是...怎么说
- 57:18 就是就算有 research,我估计也不是 Meta 去这种 push boundary
- 57:24 对
- 57:25 你说到半年写一次 PSC
- 57:28 我以前我一直都不知道这个 PSC 的流程什么样了
- 57:31 因为这个我不在 Meta 我没在 Meta 工作过
- 57:34 但我知道比如我们公司我每年做一个 IC 我做我的那个 annual end-of-year
- 57:39 这个 accomplishment document
- 57:41 就是我们叫这个名字
- 57:42 就感觉我已经花很长时间在写了
- 57:44 就我得写一堆东西
- 57:46 然后今年我刚好 transition 从一个这种 tech lead manager 这种角度
- 57:51 我现在组很小所以就还好
- 57:54 但是我看那种比如说其他 manager 下面有比如超过五个人到十个人这种级别
- 58:00 他们基本上每年年底从 11 月 12 月这两个月
- 58:04 基本就没有时间干其他任何事情了
- 58:05 因为光是十个人的这个 document 你都要准备很久
- 58:09 然后准备完了之后你还要 calibration 啊各种这种
- 58:12 无论是 SB meeting 啊什么就是就充满了琐事
- 58:15 然后如果我难以想象如果这变成每年两次
- 58:18 我们公司一年一次,没有两次
- 58:19 就一年一次我都感觉很占时间了
- 58:23 然后如果说还要每年两次,那我感觉基本上就没有时间干活了
- 58:27 这也是为什么我在 Meta 会有那么多时间旅游
- 58:32 对因为你们时不时在搞 PSC 是吧
- 58:35 对反正 anyway 我觉得对接下来这段旅程挺期待的
- 58:41 到时候可以分享一下
- 58:44 对
- 58:45 你们公司现在就几十个人是吧
- 58:47 就 70 个人。你说 70 个人
- 58:48 但是他们 target 的是要招到明年招到 200 个
- 58:52 我觉得挺 ambitious 的
- 58:54 如果大家有兴趣可以找我 refer。我们公司在纽约
- 58:59 是在纽约的
- 59:00 我们现在有三个 office:纽约、三藩和伦敦
- 59:04 然后都可以去。三藩主要是做 pre-training
- 59:09 然后纽约主要是做 core
- 59:13 就是纽约是所有人都在这边,每个 team 都有
- 59:15 然后伦敦是有一些做 agent 的
- 59:19 因为之前 DeepMind 的有伦敦的人
- 59:21 所以他们就在那边做了一些
- 59:23 然后也有一些伦敦的人也有一些做 data 的
- 59:27 反正也有一些做 product 的
- 59:29 可以可以挺好的挺好的
- 59:32 之后把那链接放在里面然后可以跟你去联系
- 59:34 可以可以可以
- 59:38 对我也挺好的
- 59:39 关键三周是一个挺蜜月期的
- 59:42 确实。太多可以吐槽
- 59:44 一般我感觉蜜月期怎么样得三四个月
- 59:48 对至少得三四个月
- 59:49 甚至可能有的半年到一年
- 59:50 我感觉才能够...特别是 startup
- 59:52 我感觉 startup 因为毕竟是个比较活力满满的一个地方
- 59:57 可能比较让你能够蜜月期久一点点
- 01:00:00 不像大厂可能几个月就能看到头
- 01:00:02 说不定半年一年你才能够有一些更深刻的体会
- 01:00:05 对是的
- 01:00:06 然后那个时候你就会发现这些东西出现了
- 01:00:11 就比如说有一些很好或者很坏的东西
- 01:00:14 一般人就是很坏的东西出现了然后你就开始意识到原来这个东西它不是我以前想的那样
- 01:00:21 然后你就会去想这个是不是我能接受的
- 01:00:25 如果能接受...
- 01:00:26 我一直都觉得 incentive structure 是个特别复杂特别难的一个问题
- 01:00:30 就是
- 01:00:31 我觉得 startup 之所以会有这种感觉就感觉就很活力满满
- 01:00:35 就是因为他缺的东西太多了
- 01:00:39 就你无论干什么东西都是可以被 reward 的
- 01:00:42 对啊
- 01:00:44 你干 infra 也可以被 reward,你干那个也可以被 reward
- 01:00:45 然后等到一个越来越成熟的 startup 慢慢向大公司靠拢的情况下
- 01:00:50 ideally 它是要越来越大的嘛
- 01:00:52 向大公司靠拢后 incentive structure 特别特别难
- 01:00:55 就举个最简单的例子就是比如在我们这种 research org 里面
- 01:01:00 我们这种 incentive structure 特别难去把它清清楚楚地量化成可以 check box 那种
- 01:01:08 基本没有很难。就因为如果说你把你的 research 定成是一个那种 blue sky 对吧
- 01:01:14 你可以做 open-ended research。那怎么去 evaluate 这些人做了 open-ended research,哪个人更好哪个人更不好呢?
- 01:01:19 你怎么去给一个人甚至快给甚至慢的...
- 01:01:22 你又不能只靠 citation 或者靠什么这种 metrics
- 01:01:26 而且现在 citation 就是你只要你的名字出现在一个 report 里面...
- 01:01:31 exactly
- 01:01:32 所以我们其实不是用这种 paper 方面的东西去 evaluate
- 01:01:36 好那你用产品的 impact 的话,那就变成了...
- 01:01:39 OK 那你如果要做很多产品 impact 的话,那你可能就会做很多 incremental feature
- 01:01:43 可能跟 research 没有什么关系。那你做的多了你就会问说那这个东西是不是真的需要一个 research 背景的人来做?
- 01:01:49 还是你其实找一个那种偏就懂一点技术、懂一点 research 的说不定都可以做的
- 01:01:55 那这个就很难去界定
- 01:01:58 所以反正我们内部的这种 incentive structure 也一直在说怎么样能确保这个 team 还是充满活力
- 01:02:03 但同时又能够满足是一个 research org 的这种东西
- 01:02:09 我知道好像在 Meta 有就是 FAIR 跟其他所有的 research 是两种 flavor
- 01:02:14 FAIR 是比较像我刚才说的那种偏 academic
- 01:02:17 对 FAIR 也命不久矣
- 01:02:19 对对不是那谁刚走了吗?
- 01:02:21 然后但是其他所有都是偏 applied research 的
- 01:02:24 就是我说的刚才第二种类型就是其实在拼产品的影响力
- 01:02:27 然后在那里面的 research scientist 我觉得可能就不是传统意义上的 researcher 了
- 01:02:32 更多的是这种 applied researcher 的感觉给我的感觉
- 01:02:35 对因为他的这种输出最多是跟产品的这种去挂钩对吧
- 01:02:43 是我的感觉是...就刚才你说的如果一个小公司变成大公司我觉得确实很难去避免这种 scale 的问题
- 01:02:52 因为这些 scale 的问题你确实需要一些 structure 去最高效地去解决它
- 01:02:59 但是如果这个公司一直保持成一个小公司我觉得应该也可以
- 01:03:07 对我觉得如果公司不成长的话其实就不会有这个问题
- 01:03:10 就比如 Valve 的 Steam,我觉得他们就特别的像一个很神秘但是大家都觉得很厉害的地方
- 01:03:17 Steam 的确是
- 01:03:19 一般这种公司基本都是不上市的公司
- 01:03:22 然后而且又是规模非常小的。像你说的对。
- 01:03:25 就它不会疯狂疯狂扩张的
- 01:03:27 因为一旦有扩张就会有扩张的一些问题出现
- 01:03:30 只要你不扩张...你刚才讲的是 Steam 这一例子我感觉觉得非常的好
- 01:03:33 然后我刚才想的就是那种很小的那种或者那种 private hedge fund 那种
- 01:03:40 对那种我了解的比较少所以没法 comment
- 01:03:43 对但我之前是说比如有那种 privately owned 那种 consulting firm 的
- 01:03:47 然后我有些朋友在那种 consulting firm 工作,他说那种反正也不太扩张也不太缩水
- 01:03:52 然后反正每年就是固定地帮几个那种大的公司去打打工
- 01:03:56 然后那种也非常的...文化就比较 constant 不太会变化
- 01:04:00 对
- 01:04:01 但如果说你再加入那种大的 consulting firm 那几个那种头部公司
- 01:04:05 那我感觉遇到的问题会跟大厂遇到的问题基本上是一模一样的
- 01:04:11 对一模一样的
- 01:04:12 我现在觉得比如什么 DeepSeek 应该也挺好的就是他们的氛围之类的
- 01:04:21 因为我感觉他们没有扩张很快然后他们每逢节假日还能扔一个炸弹出来
- 01:04:28 对
- 01:04:30 他们好像最近又出了一个 3.2 对,还挺强的
- 01:04:35 我觉得 DeepSeek 的 infra 也挺厉害的就是他们最近出的这个创新
- 01:04:41 你现在居然对 DeepSeek 这么...你对他们钻研也比较深
- 01:04:46 因为你们想做美国的 DeepSeek
- 01:04:48 不如下面之后我们找一期来聊一聊你对 DeepSeek 的这个不论是模型还是公司还是他们这种的了解
- 01:04:55 我感觉这个也挺有意思。因为我现在可以把你当成是一个 LLM 来问你一些问题。
- 01:05:01 然后因为我对 DeepSeek 也很好奇但是一直都没有很多机会去好好地去了解
- 01:05:06 好的好的
- 01:05:07 我其实对他们的内部什么我也不是很熟悉,但只是可能我在这个里面做对他们关注更多
- 01:05:15 我也可以聊一些
- 01:05:16 但我觉得可以。反正之后可以...
- 01:05:20 对我不知道你这个东西跳槽了然后别的话题没有 cover 到,我们下一次也可以一起再聊一下
- 01:05:25 可以。我觉得下一次就可以聊一些经验了,就是加入新公司创业公司的这些经历
- 01:05:30 反正我觉得最近应该不缺话题
- 01:05:33 可以可以行
- 01:05:35 那那刚好下次我也可以聊一聊我换组的这个
- 01:05:37 然后我换组这个之后,下一次才可以聊你的下篇
- 01:05:41 对。行行行
- 01:05:43 行好,那我们这期节目就到这里了
- 01:05:45 然后我会把你新公司的这个链接放在下面,大家感兴趣的可以去了解一下
- 01:05:49 然后找明锐内推拿推荐 bonus
- 01:05:53 对
- 01:05:54 我不知道我们有没有 bonus,但是现在招人很多。
- 01:05:58 所以就欢迎。欢迎联系
- 01:06:00 可以。行好。那我们下期见。