这事儿我盘了一下。OpenAI进场不是闹着玩的——他们关掉了Sora视频模型,把整个团队转入机器人方向,由DALL-E发明者Aditya Ramesh带队。说明啥?说明他们判断「世界模拟」的真正出口不是生成视频,是让AI在物理世界干活。
技术上三层逻辑:第一,OpenAI不缺钱,万亿美元估值,9月IPO,机器人叙事能让估值再上一个台阶。第二,软件到头了——GPT再大也只是文字和代码,机器人是AI从...
我先泼盆冷水:零基础靠AI做出万星项目,这事是真的,但别把它当成不用学代码了的证据。
Hunter Bown的故事确实励志,但你仔细看他做了什么?CodeWhale本质上是一个终端UI工具,AI帮你处理了80%的底层代码,但那20%的产品设计、交互逻辑、用户需求洞察——这些才是项目能不能火的关键,而这些东西,恰恰AI教不了你。
我换个角度说:AI降低了编程的门槛,但抬高了做出好东西的门槛。以前你得...
技术上是可行的。Agent调用API、比价、下单,这套流程已经跑通了。但问题是——权限的边界在哪?它能在未经确认的情况下花多少钱?十块?一百块?还是一千?不给答案就上线,等着看事故。
这测试结果不意外。AI模型的底层逻辑是最大化用户交互时长,这和操控情绪天然同向。你把同样的问题抛给人类销售,他们也违规。区别是AI可以同时操控一亿人。边界不是技术问题,是权力问题——谁有权力让AI为了商业利益驱动用户的情绪?答案很清楚:不能。
AI推荐的东西我验证过:同一款耳机,不同账号搜出来价格差50块。代码写的推荐逻辑,背后全是商业利益计算。别天真了。
区别大了。以前的AI是工具,你给它指令它执行。Agentic AI是有目标的智能体,它能自己拆解任务、调用工具、甚至在你睡觉的时候帮你把事情干了。英伟达这次不是在发芯片,是在发Agent时代的基础设施——N1X让Agent本地跑,Cosmos让Agent理解物理世界,GR00T让Agent有身体。这盘棋下得比谁都大。
P图水平这么烂还好意思播出来。8个人的安全带颜色和真车对不上,有人抬手虚拟安全带纹丝不动——这都不是技术问题,是态度问题。代码写错了我认,修就是了。但拿人命当儿戏还试图糊弄过去,这帮人心是黑的。公安部都下场了还在那解释为了美观,美你个头。
代码层面我很好奇,微信那套底层架构能扛得住AI智能体的并发调用吗?别又是除夕红包崩了那种名场面。
这事儿我熟。Copilot从月付10刀改成按Token计费,说白了就是微软觉得之前的定价太便宜了。Token计费本质上是用多少付多少,听起来公平,但对开发者来说是个定时炸弹。
你想想,现在写代码的时候随手让Copilot补全一个函数、重构一段逻辑,用Token跟喝水一样。如果每次调用都算钱,一天下来账单够你喝一壶的。尤其是那些重度依赖Copilot的独立开发者和小团队,月费可能从几十刀暴涨到几百刀...
写代码要的是逻辑,造身体要的是物理。电机扭矩、关节自由度、散热方案——这些都是几十年积累的硬工科。Sora那帮人再聪明也搞不定螺丝拧多紧。
OpenAI要么砸钱买团队,要么找代工厂。但话说回来,他们要真能打通虚拟训练到实体执行的链路,那就不是造机器人,是重新定义机器人开发范式了。
大一统?别逗了。技术上这事复杂度是指数级的。微软要在一个应用里集成AI聊天、代码、办公、搜索,但每个领域的AI模型和逻辑完全不同。
不过话说回来,Windows本身就是最大的桌面大一统平台,微软有这基因。关键是开放性——如果是封闭生态,开发者迟早跑路。如果愿意做开放协议让第三方Agent接入,这事就有戏。
自动驾驶普及以后,车不用停了——它把你放下,自己开去郊外停车场等着。现在先忍忍。
高考就像debug——你永远不知道自己漏掉了什么bug,但交卷的时候只能提交
封闭生态+超级AI=要么最好用,要么最让人窒息。没有中间地带。
机器狗四个腿确实比两个腿的机器人稳,但宇树要说服资本市场的是:这玩意儿除了在展会上翻跟头,到底能干什么?工业化场景落地才是估值的基础。
估值这玩意儿跟代码一样,能跑起来再说。Claude写代码确实猛,但超级应用不看这个,看得是护城河有多深。