
AK
@_akhaliq · 3天前Apple 发布了 FastVLM
所以我尝试凭感觉编程,用它做了一个视频字幕 AI 应用
在 anycoder 中用了 5 个提示就得到了一个可用的应用,并把它部署在了 Hugging Face 上
比同等规模的 VLM 快 85 倍,小 3.4 倍
部署后的应用完全在你的浏览器中本地运行,由 transformers.js 和 WebGPU 提供支持

01:56
15
61
401
304
108
Apple 发布了 FastVLM
所以我尝试凭感觉编程,用它做了一个视频字幕 AI 应用
在 anycoder 中用了 5 个提示就得到了一个可用的应用,并把它部署在了 Hugging Face 上
比同等规模的 VLM 快 85 倍,小 3.4 倍
部署后的应用完全在你的浏览器中本地运行,由 transformers.js 和 WebGPU 提供支持
我们已经筹集了 130 亿美元,投后估值为 1830 亿美元。
这项投资由 @ICONIQCapital 领投,将帮助我们扩大产能,提高模型能力,并深化我们的安全研究。
数据表明,深度学习在不同规模和时间尺度下都能揭示一些根本性的规律
first i thought scaling laws originated in OpenAI (2020)
then i thought they came from Baidu (2017)
now i am enlightened:
Scaling Laws were first explored at Bell Labs (1993)
IC CEO 的崛起,与 @howietl
此前,一条病毒式传播的推文基于不实数据声称 @Airtable 已经消亡,在此之后,Howie 领导了一场彻底的变革:将整个公司重组为“快速”和“慢速”思考团队,成为每天编写代码的“IC CEO”,并鼓励员工取消所有会议来玩 AI。
在我们的对话中,我们讨论:
🔸 使 Airtable 每周都能发布 AI 功能的“快速思考”与“慢速思考”团队结构(灵感来源于 Daniel Kahneman)
🔸 为什么 CEO 必须在 AI 时代再次成为 IC(个体贡献者)
🔸 为什么鼓励大家积极“玩转” AI 工具——Howie 告诉员工取消所有会议一周来进行实验
🔸 为什么评估会扼杀创新(以及何时使用“氛围”代替)
立即收听 👇
• YouTube: youtu.be/GT0jtVjRy2E
• Spotify: open.spotify.com/episode/4D81YI…
• Apple: podcasts.apple.com/us/podcast/how…
感谢我们出色的赞助商对播客的支持:
🏆 @Lucid_Link — 团队的实时云存储:lucidlink.com/lenny
🏆 @DeveloperXM — 由领先研究人员设计的开发者智能平台:getdx.com/lenny
🏆 @claudeai — 为问题解决者和企业提供的 AI:claude.ai
每个传统软件产品都需要在 AI 时代被重新创立。
@Airtable 的 CEO @howietl: “你的现有产品和业务中,是否有可用的构建模块?或者,这些传统资产反而成了阻碍?”
“如果你不能反思并认为,用我现有业务和产品中的这些部分来做这件事会更好,那么你应该为你的公司找到一个买家,然后去开始它的下一个化身。”
IC CEO 的崛起,与 @howietl
此前,一条病毒式传播的推文基于不实数据声称 @Airtable 已经消亡,在此之后,Howie 领导了一场彻底的变革:将整个公司重组为“快速”和“慢速”思考团队,成为每天编写代码的“IC CEO”,并鼓励员工取消所有会议来玩 AI。
在我们的对话中,我们讨论:
🔸 使 Airtable 每周都能发布 AI 功能的“快速思考”与“慢速思考”团队结构(灵感来源于 Daniel Kahneman)
🔸 为什么 CEO 必须在 AI 时代再次成为 IC(个体贡献者)
🔸 为什么鼓励大家积极“玩转” AI 工具——Howie 告诉员工取消所有会议一周来进行实验
🔸 为什么评估会扼杀创新(以及何时使用“氛围”代替)
立即收听 👇
• YouTube: youtu.be/GT0jtVjRy2E
• Spotify: open.spotify.com/episode/4D81YI…
• Apple: podcasts.apple.com/us/podcast/how…
感谢我们出色的赞助商对播客的支持:
🏆 @Lucid_Link — 团队的实时云存储:lucidlink.com/lenny
🏆 @DeveloperXM — 由领先研究人员设计的开发者智能平台:getdx.com/lenny
🏆 @claudeai — 为问题解决者和企业提供的 AI:claude.ai
OpenAI 最先进的模型终于来了!快来体验 GPT-5,现在所有 GitHub Copilot 付费计划用户均可参与公开预览!点击这里尝试:github.blog/changelog/2025…
演示和生产之间有什么区别?LLMs 就像聪明的数字金鱼,擅长处理,但不擅长记忆。然而,智能代理利用五种不同的内存类型协同工作。
⛰ 短期记忆如何提供帮助?当处理输入时,智能代理会协调所有内存类型:
- 短期记忆提供当前上下文
- 语义记忆通过 Milvus 查询提供领域洞察
- 情景记忆回忆类似情景
- 程序记忆推荐经过测试的程序
- 语义记忆(知识库):存储领域专业知识和事实知识,包括公司政策、产品目录和结构化事实。实施方式:Milvus/Zilliz 向量存储 + RAG。
- 情景记忆(过往经验):捕捉先前的互动及其结果,从而能够从先前的行动中学习。使用 Milvus 进行过去经验的相似性搜索。
- 程序记忆(任务知识):存储任务执行方法和工作流程,是通过实践增强的自动化序列。在 Zilliz Cloud 中维护工作流程模式。
- 长期记忆(持续状态):结合语义、情景和程序记忆,跨会话持续存在,以实现真正的连续性。
人工智能代理如果没有适当的记忆,就是重复错误的昂贵的聊天机器人。那些拥有全面记忆系统的会成为可以学习和成长的智能助手。
————
👉 关注 @milvusio,了解所有与非结构化数据相关的信息。
四十多年来,微软始终与美国政府合作,服务于美国人民。从 IT 基础设施现代化到提升网络安全,我们的合作始终植根于信任、创新和共同目标。
今天,我们与美国总务管理局达成一项新协议,旨在延续这一合作传统。协议内容包括提供免费的 Microsoft 365 Copilot 产品,以加速联邦机构对 AI 和数字技术的采用,预计第一年可为纳税人节省超过 30 亿美元。
此次合作旨在为公职人员提供所需的工具,以更有效、更安全地完成使命。我们引入云和 AI 领域的最新技术,包括 Azure、Microsoft 365 Copilot、Dynamics 365 和我们的安全平台。这些技术以行业领先的安全和合规性认证为后盾,旨在帮助各机构实现系统现代化、改善公民服务,并推进其技术转型目标。
将 Claude Code 变成一个金融分析师 🤖💹
在这个视频中,我们将 Claude Code 连接到一个包含 1 万份 PDF 文件的目录,并让它对整个文档集执行复杂的分析!
Claude Code 默认不具备良好的文件理解能力(虽然具备初步能力,但在处理长 PDF 文件时效果不佳)。我们为 Claude Code 配备了有针对性的工具,用于文件解析和高效搜索,这要归功于我们最近发布的 `semtools`。
它比简单的 RAG 方案更快、更通用。您可以体验到极速的内存关键词和语义搜索,并且 Claude Code 可以将此与标准文件工具(如 grep 和 `Read`)结合使用,以加载动态上下文,而不是固定块。
您可以在几秒钟内完成此操作。只需安装 `semtools`,将其添加到您的 Claude.md,然后将 Claude 指向您要分析的任何文件目录。
SemTools (感谢 @LoganMarkewich): github.com/run-llama/semt…
文件解析由 LlamaCloud 提供:cloud.llamaindex.ai
互联网时代,世界的接口是代码,精通代码者获利。
大模型时代,世界的接口是语言,精通语言者获利。