推文

Qwen

Qwen

1天前
🚀 Qwen3.5-Omni 来了!迈向原生全模态 AGI。

遇见下一代 Qwen,专为原生文本、图像、音频和视频理解而设计,在智能水平和实时交互方面均有重大突破。

一大亮点:‘视听氛围编程’ (Audio-Visual Vibe Coding)。只需对着摄像头描述你的构想,Qwen3.5-Omni-Plus 就能立刻为你构建功能完备的网站或游戏。

离线亮点:
🎞️ 脚本级字幕生成:生成带时间戳、场景切分和说话人映射的详细视频脚本。
🏆 SOTA 性能:在音频方面超越 Gemini-3.1 Pro,并匹配其视听理解能力。
🧠 海量容量:原生处理长达 10 小时的音频或 400 秒的 720p 视频,基于超 1 亿小时的数据训练。
🌎 全球覆盖:识别 113 种语言(语音)并支持 36 种语言口语。

实时功能:
🎧 精细化语音控制:实时调整情感、语速和音量。
🔍 内置网络搜索与复杂函数调用。
👤 语音克隆:通过简短样本自定义 AI 声音,工程化部署即将推出。
💬 类人对话:智能轮次切换,理解真实意图并忽略噪音。

Qwen3.5-Omni 系列包括 Plus、Flash 和 Light 版本。

立即尝试:
博客:qwen.ai/blog?id=qwen3.…
实时交互:点击 VoiceChat/VideoChat 按钮(右下角):chat.qwen.ai
HF-Demo:huggingface.co/spaces/Qwen/Qw…
HF-VoiceOnline-Demo:huggingface.co/spaces/Qwen/Qw…
API-Offline:alibabacloud.com/help/en/model-…
API-Realtime:alibabacloud.com/help/en/model-…
推文图片
157
557
4,340
2,369
1,041
Claude

Claude

1天前
电脑操控 (Computer Use) 功能现已登陆 Claude Code。

Claude 可以直接从 CLI 启动你的应用程序,点击你的 UI,并测试它所构建的内容。

目前已在 Pro 和 Max 订阅计划中提供研究预览。
视频缩略图
00:45
2,453
4,607
5.6万
2.4万
1.2万
Satya Nadella

Satya Nadella

1天前
隆重推出 Critique,这是 M365 Copilot 中一套全新的多模型深度研究系统。

你可以结合使用多个模型来生成最优的回复和报告。
视频缩略图
00:50
418
500
4,058
1,650
962
GREG ISENBERG

GREG ISENBERG

1天前
每天有超过 20 万个新的 vibe coding 项目诞生,但几乎没有一个能获得客户。

以下是目前对你的初创公司真正有效的 7 种分发策略:

1. 构建一个 MCP server。当有人向 Claude 或 ChatGPT 提问你的产品所能解决的问题时,你的工具就会出现。AI 变成了你的销售团队。

2. 编程化 SEO。选择一种关键词模式(例如:best X for Y)。使用 Firecrawl 抓取真实的结构化数据,确保页面具有实际价值。一个 Next.js 模板 + AI 生成内容 + 人工编辑循环,确保读起来不像 AI 写的。10,000 个页面 × 30 次访问 × 2% 转化率 × 10 美元 = 每月 6 万美元的收入,而这些页面你只需构建一次。

3. 用 vibe coding 开发一个免费工具(计算器、软件等)。解决一个问题,做一个工具,今天就发布。它能获得排名,融入人们的工作流,并为你的品牌进行长达数年的营销。Ahrefs 的免费反向链接检查工具为他们带来的客户比大多数付费广告都要多。

4. 答案引擎优化(AEO)。人们现在通过 ChatGPT 和 Perplexity 获取答案,而不仅仅是 Google。找出你的客户正在向 AI 询问的热门问题。发布结构化、权威的答案。一位创始人仅通过这样做,就在一个月内将 AI 引流比例从 4% 提升到了 20%。

5. 让你的产品输出具有可分享性。参考 Spotify Wrapped、GitHub Graphs、Stripe Atlas。

你的用户想截图发送什么?打造那个瞬间。添加一个预填写的分享按钮。每一次分享都是对你精准受众的免费曝光。

6. 收购一个垂直领域的 Newsletter。用 5000 到 2 万美元收购 1 万订阅者。大多数所有者每月收入在 0 到 500 美元之间。私信他们:“有没有考虑过出售?”你第一天就继承了信任,并拥有了直达精准客户的渠道。被低估了。

7. 把 30 分钟的语音备忘录发给 Claude:生成 5 条推文串、3 篇 LinkedIn 帖子、1 篇 Newsletter、短视频剪辑。每周坚持做。3 个月后,你拥有的内容量将超过那些没这么做的竞争对手。当然,你的项目需要优化,确保它不是 AI 垃圾内容,但你会做到的。

代码已实现商品化。是时候专注于分发了。

挑选其中 2 个想法,本周就开始行动去获取客户吧。

本期节目旨在激发你的创意灵感。也许它会为你本周使用的增长策略提供更多思路。

完整解析请关注 @startupideaspod

观看。
视频缩略图
27:18
188
127
1,274
2,867
749
a16z

a16z

21小时前
马克·安德森表示,AI 是公司裁员的“万能借口”,但大多数裁员实际上是由于高利率和疫情期间过度招聘造成的:

“整个劳动力替代的说法是 100% 不正确的。这完全是错误的。这是典型的零和经济学。”

“这是两者的结合——疫情期间利率降至零,以及所有这些公司在转向虚拟办公时失去了纪律,员工变成了一个屏幕上的图标。”

“现在发生的情况是,基本上每家大公司都人浮于事。我们可以争论具体程度——至少超编了 25%。我认为大多数大公司超编了 50%。很多甚至超编了 75%。”

“现在他们都有了万能借口——那就是 AI。”

@pmarca@HarryStebbings 的对话
视频缩略图
04:00
77
121
1,049
404
251
OpenAI Developers

OpenAI Developers

1天前
📢 大规模构建语音智能体的经验教训

@perplexity_ai 详细拆解了他们在生产环境中运行语音服务时,Realtime API 如何重塑了他们对上下文、音频管道和轮次控制在现实场景中的处理方式。

developers.openai.com/blog/realtime-…
34
42
376
201
102
a16z

a16z

2小时前
马克·安德森表示,AI 99.9999% 的价值将流向 AI 的使用者,而不是创造它的公司:

“如果你看看互联网带来的经济价值创造总量——大约 99% 都流向了互联网的使用者,而不是构建互联网的公司。”

“智能手机也是一样。谁获得了智能手机的经济价值?世界上每一个利用智能手机提高生活或工作效率的人,获得了智能手机 99% 的价值。苹果 (Apple) 和谷歌 (Google) 只获得了 1% 的价值。”

“我认为 AI 也将完全一样。甚至可能比这更甚——AI 99.9999% 的价值都将流向使用者,而不是制造 AI 的公司。”

@pmarca@HarryStebbings 对谈
视频缩略图
01:52
23
25
137
39
43
meng shao

meng shao

11小时前
Claude Code 源代码泄露了?

据说是在 Claude Code NPM 页面 cli.js. map 泄露的,源码下载地址在这,朋友们可以跟你的 Claude Code 一起学习 Claude Code 源码 😄,感谢 @Fried_rice 分享!…a8527898604c1bbb12468b1581d95e.r2.dev/src.zipq

我让我的 Codex 来解读它,初步看源代码,把对话、工具调用、子智能体、后台任务、MCP、插件、远程会话、权限控制、终端 UI 都放进了同一套运行时里。

从规模看,它已经明显超过普通 CLI:utils 约 18 万行、components 约 8 万行、services 和 tools 都在 5 万行量级,入口 main.tsx (line 1) 单文件也有 4600 多行。这说明它是成熟产品代码,不是演示型项目。

- 架构有四层 -

第一层是“产品入口 + 启动编排”
· main.tsx (line 1) 一开始就在抢启动时间,提前做性能打点、MDM 读取、Keychain 预取,再加载命令、工具、远程配置、插件和技能;
· init.ts (line 57) 继续处理配置启用、安全环境变量、证书、智能体、遥测、LSP 清理、scratchpad 等。这类写法说明团队很重视冷启动和复杂运行环境。

第二层是“统一工具运行时”
· Tool.ts (line 113) 定义了工具上下文、权限、状态更新、消息流、文件历史、通知等公共协议;
· tools.ts (line 193) 则把 Bash、读写文件、Web、MCP、计划模式、任务、子智能体等能力统一注册,并按 feature flag、权限、环境动态裁剪。
也就是说,Claude Code 的核心是“模型如何安全地调用一组受控工具”。

第三层是“任务与智能体系统”
· AgentTool.tsx (line 81) 直接把子智能体作为一等能力,支持模型、权限模式、后台运行、worktree 隔离、远程执行等;
· LocalAgentTask.tsx (line 23) 负责追踪 token、最近工具活动、消息队列、前后台切换、结果通知;
· Task.ts (line 5) 和 tasks.ts (line 16) 说明“Shell 任务、Local Agent、Remote Agent、Dream、Workflow、Monitor”都被抽象成同类对象。
这个设计比常见“边聊边跑命令”的实现更像一个轻量调度系统。

第四层是“扩展与外部集成”
· commands.ts (line 1) 暴露了非常多的产品命令;
· services/mcp/client.ts (line 1) 说明 MCP 支持是深度接入,不只是简单发请求,而是覆盖了 stdio、SSE、streamable HTTP、WebSocket、认证、超时、结果截断、资源与 prompt 管理。
这意味着它把本地工具、远程服务、IDE、浏览器、插件生态都放进了同一接口层。
推文图片
Chaofan Shou (svm/acc)

Chaofan Shou (svm/acc)

12小时前
Claude code source code has been leaked via a map file in their npm registry! 

Code: …a8527898604c1bbb12468b1581d95e.r2.dev/src.zip
推文图片
2,472
5,361
3.5万
4
4
38
47
16
宝玉

宝玉

2小时前
看鸭哥写的:《AI 工程的真实代价:从 Claude Code 泄露源码看新模型接入的工程现实》
yage.ai/share/claude-c…

里面提到了 Anthropic 在 Claude Code 里埋了三层反蒸馏机制,专门防竞争对手用 API 输出来训练自己的模型。泄露的源码把这套系统完整暴露了出来。

第一层:往输出里掺假。API 返回结果时,服务端会混入一些虚假的工具调用数据。正常用户完全不受影响,服务端会帮你过滤掉。但如果有人批量抓取 API 输出去训练模型,这些假数据会一起被吃进训练集,污染模型质量。

第二层:把推理过程藏起来。Claude 在工具调用之间会产生中间推理文本,比如"我先读这个文件,再检查语法"。这些细节对蒸馏训练价值很高,因为它暴露了模型怎么思考。这一层把中间文本替换为一句摘要加密签名,下一轮对话时客户端拿签名换回原文。外部观察者只能看到摘要,完整推理链拿不到。

第三层:协议隔离。Claude Code 用一种新的 JSON 协议格式跟 API 通信,带独立的版本标记,跟每周 920 万次的普通 API 请求在统计上隔离开。服务端可以对不同群体做差异化处理,也让竞争对手无法简单伪装成 Claude Code 来获取特殊待遇。附带好处是省了大约 4.5% 的输出 token。
推文图片
宝玉

宝玉

4小时前
分析claude code源代码第一步,先跑起来。这次泄漏的代码只是source map还原后的结果,缺少很多脚手架和私有package。本来我打算自己搞一下,结果发现已经有好心人搞定了。

github.com/claude-code-be…

(我运行时有点小bug,把错误信息发给codex就搞定了)

尽早fork下载本地,估计存活不了太久😂
推文图片
23
33
250
5
16
89
72
22
Claude

Claude

1天前
现已在 macOS 上的 Pro 和 Max 订阅计划中提供研究预览。

使用 /mcp 命令启用。文档:code.claude.com/docs/en/comput…
80
83
1,763
1,351
449