小互日报-1 月 3 日
type
status
summary
date
slug
tags
category
password
icon
🔔 Xiaohu.AI日报「1月3日」
✨✨✨✨✨✨✨✨
1⃣️
🤖 微软研究团队的新进展:
- 微软利用合成数据训练AI,减少成本和偏见。
- 生成了100种语言的文本数据,提高AI训练效率。
- 论文链接:https://arxiv.org/abs/2401.00368
🔗 https://x.com/xiaohuggg/status/1742473942252855795?s=20
2⃣️
📔 Pile:AI日记软件介绍:
- 开源界面美观,助力日记撰写和记录。
- 集成OpenAI API,扩展思想和日记。
- AI搜索和问题解答功能,保证安全隐私。
- 下载链接:https://udara.io/pile/
- 项目源码:https://github.com/UdaraJay/Pile
🔗 https://x.com/xiaohuggg/status/1742427654006202439?s=20
3⃣️
👀 VCoder:视觉编码器增强模型:
- 增强LLM的视觉理解和分析能力。
- 处理分割图和深度图,改善对象感知。
- 在对象识别任务中表现优于GPT-4V。
- 项目链接:https://praeclarumjj3.github.io/vcoder/
- 代码库:https://github.com/SHI-Labs/VCoder
🔗 https://x.com/xiaohuggg/status/1742410353198416282?s=20
4⃣️
🎵 M2UGen:多模态音乐理解生成模型:
- 理解音乐风格、乐器、情感,进行音乐问答。
- 根据文本、图像、视频生成音乐。
- 编辑音乐仅需文字描述。
- 该模型由腾讯与新加坡国立大学开发
🔗 https://x.com/xiaohuggg/status/1742392202482061509?s=20
5⃣️
🗣️ DreamTalk:人物头像动画生成开源了
- 使人物照片头像根据音频说话或唱歌。
- 保持嘴型和表情一致。
- 代码库:https://github.com/ali-vilab/dreamtalk
🔗 https://x.com/xiaohuggg/status/1742382786990969226?s=20
6⃣️
💠 SVG-Loaders:纯SVG格式加载图标和动画:
- 免费下载,适用于网页和应用。
- 高质量、多样设计,易于使用和自定义。
🔗https://x.com/xiaohuggg/status/1742377903818711044?s=20
7️⃣
🐭 Mickey-1928:专注米老鼠图像生成模型:
- 基于Stable-Diffusion-xl微调,生成1928年风格米老鼠图像。
- 训练数据包括三部卡通的静止画面。
- 模型下载:https://huggingface.co/Pclanglais/Mickey-1928 🔗 https://x.com/xiaohuggg/status/1742373301929091472?s=20