知识库精选- 6 月 7 日
type
status
summary
date
slug
tags
category
password
icon
- 《视频模型:可灵》收录了大家测试的效果
- 生成超过120秒1080P视频模拟真实物理特性(重力、光影反射、液体流动等)
- 准确建模复杂运动场景(高速奔跑的动物、月球行走的宇航员等)
- 画面连贯,动作流畅,细节真实
- 支持用户输入控制信息,丰富内容控制能力
- 专用语言模型,提升生成效果
- 类Sora的DiT结构,用Transformer代替卷积网络
- 自研3D VAE网络,提升视频重建质量
- 感谢 Allan 的投稿文章《观点:热爱与行动是通往 AGI 之路》,作者分享了参与 WaytoAGI 社区的体验,强调了社区的互助与共创氛围,WaytoAGI 社区能感受到对大家的帮助,是我们最为高兴的事情!
- 《黄仁勋深度访谈:每周工作7天6点起床,60位高管都向我汇报》作者芯东西,黄仁勋在访谈时谈到创业路上充满痛苦和挑战,但这是成功的必经之路。他相信好员工是可以培养出来的,不喜欢裁员。黄仁勋对公司、产品和组织有爱和呵护的态度,希望将整个公司变成一个巨大的 AI。
- 《Seed-TTS:真假难辨的 AI 语音》Seed-TTS 是由字节跳动开发的一种高级文本到语音(TTS)模型系列,能够生成高质量、几乎无法与人类语音区分的语音。该模型可以基于简短的语音片段生成高度自然且富有表现力的语音。
- 《通义千问:Qwen2 已开源》通义千问的 Qwen2 已于 6 月 7 日开源,包括 0.5B、1.5B、7B、57B-A14B 和 72B 等多个模型。训练集涵盖除中英文外的 27 种语言,支持最多 128K 上下文。模型擅长处理代码和数学,其中 72B 使用 Qianwen License。Git 地址为 https://github.com/QwenLM/Qwen2
- 本周,Coze 共学活动第二期 参赛前六强队伍第三天带来分享的队伍是:简简单单捏 Coze团队的《一点都不简单的共创之路》,作品名字叫《这个茶馆不一般》在这里,每位客官都将化身为自己喜欢的角色,享受不同角色带来的个性化人物体验 ——《这个茶馆不一般》(B 站回放地址)