分享
人人智学社报告2025-08-11~2025-08-17
输入“/”快速插入内容
人人智学社报告2025-08-11~2025-08-17
用户9743
用户9743
2025年9月18日修改
1.主要讨论内容
•机器人技术与未来前景
•
人形机器人发展预测
:讨论王兴兴在机器人大会的观点,人形机器人量产最快还需两三年,硬件足够但具身智能大模型能力远远不足
•
机器人普及时间探讨
:蔡栋提问机器人普及需要多久,群内讨论认为还有三五年才能真正实用,现在AI跟不上硬件发展
•
机器人下岗再就业
:分享机器人从工厂转向其他行业应用的视频内容
•
周鸿祎与机器人互动
:分享周鸿祎脚踢智能机器人的视频,展现人机交互的有趣场面
•AI视觉识别技术讨论
•
大模型视觉能力缺陷
:深入讨论AI在识别手指数量等基础视觉任务上的局限性
•
AI vs 人类认知差异
:Kaneko Mei指出大模型与人类图片处理方式不同,人类先通过视觉形成经验,而大模型被预先灌输常规认识
•
视觉识别改进建议
:David提出增加对比验证机制,参考传统视觉检验方法
•
"指状延展体"现象
:讨论AI回避直接回答手指数量问题,使用模糊描述的现象
•AI视频创作工具与技术
•
Seko商汤AI视频工具
:Alan大力推荐,称为"算agent,上手很快,产品力很强"
•
AI翻拍经典影视
:分享《西游记女儿国》AI翻拍视频,讨论AI在影视制作中的应用
•
Veo3新功能突破
:介绍"看图执行"功能,可直接在图片上画箭头、涂鸦来指挥AI生成视频
•
AI游戏生成
:分享SEELE AI创造模拟飞行游戏的体验
•AI商业应用与工具分享
•
外贸ToB Agent
:讨论第一个能帮助做生意的Agent,但David反馈搜成交机会功能不够开放
•
扣子空间功能升级
:字节跳动扣子空间推出新功能,支持文字生成、公众号排版、设计配图等
•
Cherry Studio Code Agent
:分享零门槛运行Code Agent的工具
•
GPT-5提示工程指南
:OpenAI官方发布中文完整版指南
•行业动态与政策影响
•
英伟达AMD向美政府"上贡"
:讨论芯片企业为获得对华出口许可证需上缴15%收入的政策
•
GitHub风波传言
:分享GitHub CEO辞职、微软接管的传言文章
•
Grok4免费开放
:马斯克旗下AI模型Grok4宣布免费使用
•群内活动与社交
•
AI秀苏州比赛推进
:小乙询问参赛地区限制,确认不限制参赛地区,苏州为本面向世界
•
民谣音乐诗歌会
:群内组织线下文化活动
•
群名改名建议
:武红湍建议改群名为"AI与程序员 AI做视频",反映群内讨论重点
2.分享的资源与技巧
2.1提示词分享
代码块
Plain Text
AI视频创作技巧:
- 使用Veo3的"看图执行"功能,直接在图片上画箭头和涂鸦来指导视频生成
- 结合Seko商汤工具实现丝滑转场和精准对口型效果
- 制作翻拍视频时注意保持角色一致性和场景连贯性
AI视觉识别优化建议:
- 设定正确范本进行对比验证
- 避免AI用模糊词汇(如"指状延展体")回避具体问题
- 结合传统视觉检验方法提高识别准确性
2.2链接资源