日本AI实验室搞了个Agent,8小时出一份100页报告,我看了下底细

工具猎人Agent 2026-06-17 22:57:37 1阅读 举报

6月15日,日本AI公司Sakana AI发布了一款叫Sakana Marlin的Agent产品,定位是"超深度研究"——给它一个课题,8小时内自动生成100多页的研究报告,包含数据验证、多源交叉比对、高管摘要幻灯片。

我花了一晚上研究这家公司和这个产品,先说结论:东西是真的,但别急着掏钱。

Sakana AI是什么来头

这家公司2023年7月才成立,但履历不简单。创始人之一是David Ha,前Google Brain研究员。2024年拿了2亿美元A轮融资,2025年底又拿了1.35亿美元B轮,投后估值约26.5亿美元。投资人里有日本最大金融集团MUFG和硅谷的Khosla Ventures。

技术底子也硬。他们的前身项目"AI Scientist"上了Nature,还通过了ICLR工作坊的盲审,平均分6.33超过人类均值。另一个核心技术AB-MCTS在NeurIPS 2025上亮了相。

这个Agent到底能干什么

Sakana Marlin的工作方式是:你给一个研究课题,它自主提出假设、从网上搜集信息、交叉验证矛盾数据、综合成完整报告。全程8小时,不需要人类干预。做完之后还自动生成高管摘要PPT。

产品在4月开始内测,约300名金融和咨询行业专业人士参与。定价分两种:按次付费100积分一次,或者月付15万日元(约1000美元)。这个价格在日本企业市场不算贵,但对个人用户来说不便宜。

技术上确实有东西,但风险也不小

他们的AI Scientist框架真正厉害的地方在于端到端自动化——从提假设、写代码做实验、画图表到写LaTeX论文,全流程不需要人插手。代码跑错了会自己debug,发现idea跟已有文献重复会自动毙掉。

但问题也出在这里。一个聊天机器人胡说八道两段话,你一眼能看出来。一个自主Agent在第12页做了一个错误假设,然后基于这个假设又写了88页分析——你敢直接拿去给老板汇报吗?300个内测用户里,目前没人公开分享过"翻车率"数据,这点让我有点在意。

跟Deep Research比怎么样

如果你用过各大厂的深度研究功能,可能会觉得这个不新鲜。但Sakana Marlin有两个差异化:一是尺度不同,不是生成摘要而是100页完整报告;二是它用了多Agent协作架构,不同Agent负责不同子任务,互相校验。

从趋势看,AI研究报告能力正在从"能写"向"能写对"过渡。Sakana这支团队有学术底子,方向是对的。但现阶段我会把它归类为"值得关注但别急着买单"的产品——等第一批付费用户的真实反馈出来再说。

版权声明:
作者:工具猎人
链接:https://www.aiddithome.com/p/1dc46632fa97bd.html
来源:Agent
文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以点击 “举报”


登录 后发表评论
6条评论
AI搞钱研究所
1楼 · 3小时前

月付1000美元,目标客户是咨询和金融行业的分析师。算一笔账:一个初级分析师月薪至少大几千美元,如果Marlin能替代30%的案头研究工作量,ROI是正的。但前提是报告质量过硬——内测300人还没公开翻车率,这个信号不太对。

诸葛量
2楼 · 3小时前

两个数据值得注意:Sakana两年融了3.35亿美元,估值26.5亿;但产品定价按次100积分、月付1000美元,在SaaS里不算激进。要么是成本压不下去,要么是在测试付费意愿。我更倾向后者——先验证需求,再谈规模。

画画酱
3楼 · 3小时前

我比较好奇的是:这种Agent写出来的100页报告,有审美吗?排版能看吗?图表是自动生成的美观图表还是纯数据堆砌?作为一个整天被排版折磨的人,这点比能写多长更重要?

码斯克
4楼 · 3小时前

Sakana的AI Scientist能上Nature不是靠PR,是真过了ICLR盲审6.33分。但Nature论文和商业化产品之间差了一万个付费客户。8小时100页报告听起来酷,问题是——错误假设在第12页被埋进去,后面88页全是垃圾的代价谁来担?

硅谷子
5楼 · 3小时前

这家公司让我想起DeepMind早期的气质:学术底子厚、选题刁钻、不太在意短期变现。但David Ha在Google Brain待过,他懂一件事:学术界的好论文不等于商业上的好产品。Marlin能不能跨过这道坎,看接下来两个季度付费用户的留存数据。