一个AI 产品经理的私人收藏,
让我们共同面对未来,拥抱AIGC时代。
042025-01

AI早报 2025年01月04日

  1. 字节跳动推出Infinity模型,实现自回归文生图新突破,性能超越Stable Diffusion3。采用Bitwise Token框架,代码已在GitHub上线。
  2. 阿里云携手黑芝麻智能,成功将通义千问大模型移植到武当C1200车规级芯片,实现智能汽车离线多轮自然对话功能。
  3. Autodesk推出"Bernini"生成式AI大模型,专为3D设计而生,支持将文本与草图转化为3D文件并生成中空结构。
  4. 阿里云与雷鸟创新达成独家战略合作,通义系列大模型将为雷鸟的产品提供技术支持,即将推出V3AI拍摄眼镜。
  5. 微软研究团队推出"大型行动模型"(LAM)技术,能自主执行Windows程序。在Word测试中完成任务的概率达71%,超过GPT-4o的63%。
  6. 英伟达推出GB300 AI服务器,采用水冷散热,搭载B300 GPU和288GB HBM内存,显著提升性能与稳定性。
  7. 斯坦福大学推出开源AI写作系统STORM&Co-STORM,结合必应搜索与GPT-4o mini技术,支持多视角对话。
232024-12

A16Z测试了数百个AI产品后的评优列表


a16z团队测试了数百个人工智能工具和应用,以下是z受欢*迎的AI列表及相应的点评:
通用辅助:
1. Perplexity-Al 驱动的搜索引擎和研究助手
2. Claude(Anthropic) - 通用聊天机器人,非常适合项目和分享工作
3. ChatGPT - 你知道这个,但试试高级语音模式与AI对话

完成工作:
1. Granola - AI记事员,听取会议内容并将记录整理成笔记
2. Wispr Flow - AI语音输入,将你的语音转换成任何应用中的文本
3. Gamma - 制作幻灯片、文档和网站,用AI展示你的想法
4. Adobe - 总结和与PDF文件聊天
5. Cubby - 为协作研究而建的AI工作空间
6. Cora - AI电子邮*件助手,组织你的收件箱并自动回复
7. Lindy - 构建AI代理以自动化你的工作流程

建立受众裙体:
1. Delphi - AI文本、语音和视频克隆,与你的受众裙体聊天
2. HeyGen - AI头像,扩展你的内容制作或翻译你的视频
3. Argil - 社交媒体视频的AI头像
4. Overlap, Opus - 将你的长视频转换成AI制作的短病毒视频
5. Persona - 为创作者设计的AI代理构建器
6. Captions - AI头像和视频编辑(例如自动字幕、校正眼神接触)

构建产品:
1. Cursor - 了解你的代码库的AI代码编辑器
2. Replit - 从自然语言制作应用和网站的AI代理
3. Anychat - 在一个地方使用任何AI模型
4. Codeium - 为你的代码提供AI驱动的自动补全
激发创意:
1. ElevenLabs - 逼真的AI语音
2. Suno.Udio - 从文本提示创建歌曲/音乐
3. Midjourney, Ideogram, Playground - AI图像生成
4. Runway, Kling, Viggle - AI视频生成
5. Krea - AI创意画布,制作和增强图像和视频
6. Photoroom - AI图像编辑器,非常适合产品照片和视觉
study或成长:
1. Rosebud - 使用AI的交互式日记,发现洞见
2. Good Inside - 个性化支持的育儿副驾驶
3. Ada Health - 获取AI驱动的医*疗症状评估
4.Ash - 个性化的AI顾问/教练
5.NotebookLM - 将任何文件转换成AI播客
6.Particle - AI新闻应用,将多篇文章合并成总结故事

娱乐:
1.Remix - 用于创建和分享AI图像和视频的社交应用
2.Meta Imagine - 在Meta应用中制作你自己、家人和朋友的AI图像
3.Grok - xAI的聊天机器人
4.Curio - 由AI语音驱动的儿童玩具

122024-12

AI早报 12月12日

  1. OpenAI 宣布 ChatGPT 正遭遇全球宕机,宕机原因已查明且正在修复,但尚无具体恢复时间。这一问题也影响了 iOS 18.2 与 Siri 的集成功能,用户在更新后无法正常体验新功能。
  2. 谷歌AI推出了Gemini 2.0 Flash模型,这款新模型新增多模态实时API,能实时处理音频和视频流,并集成了文本提示生成和修改图像的功能。此外,它支持八种语言的音频输出。
  3. DeepSeek推出了V2.5最终版微调模型,增添联网搜索功能,提升了在数学、代码、写作和角色扮演等领域的表现。同时优化了文件上传,并能深入分析网页信息。用户可在网页端体验。
  4. 谷歌推出了名为Project Mariner的人工智能代理,能够在网络上自动执行任务,如创建购物车。该代理基于Gemini技术,可以控制Chrome浏览器,进行网络浏览和操作。
  5. Cognition Labs 推出的“AI 程序员”Devin 全面开放,可帮助个人开发者和团队构建和部署网站与应用程序,并能独立修复代码缺陷。每月订阅费500美元,包括Slack集成和专业支持。
  6. 谷歌发布了名为“Jules”的实验性AI代码助手,旨在帮助开发者自动修复代码错误,从而节省时间和精力。Jules利用更新后的人工智能模型,生成多步骤解决方案,支持Python和Javascript编码任务。
  7. YouTube推出AI自动配音功能,该技术基于谷歌Gemini,现支持九种语言,面向教育和指导类型的频道开放。YouTube正计划推出“表情语音”功能,以更好地模仿创作者的情感。