直达「 通往AGI之路 」飞书知识库 →
小互日报-2 月 5 日
小互日报-2 月 5 日
资讯|2024-2-5|最后更新: 2024-2-6
type
status
summary
date
slug
tags
category
password
icon
1⃣️
🌏 日本计划3月推出数字游民签证,最长停留180天:
  • 适合年收入达1000万日元的远程工作者。
  • 包括IT和自由职业者,允许携带家庭成员。
  • 需持有私人健康保险。
notion image
 
2⃣️
🎭 香港公司因Deepfake技术被骗2500万美元:
  • 使用深度伪造技术假冒CFO在视频会议中。
  • 诈骗者通过修改公开视频实施诈骗。
🔗 https://cnn.com/2024/02/04/asia/deepfake-cfo-scam-hong-kong-intl-hnk/index.html
🔗 https://x.com/xiaohuggg/status/1754446846649631013?s=20
 
3⃣️
🍏 Apple Vision Pro的研发历程:
  • 自2007年开始研发,持续十余年。
  • 展现苹果公司的长期投入和创新能力。
🔗 https://x.com/xiaohuggg/status/1754392009207628003?s=20
 
4⃣️
🖋️ AI春联在线生成器体验:
  • 提供在线生成和开源地址。
  • 用户可生成个性化春联。
 
notion image
 
5⃣️
📸 电商产品照片编辑工具:
  • 自动去背景,简化产品照片编辑流程。
  • 提供免费和高级版本,适合电商和小商家。
 
 
6⃣️
📷 苹果开源图像编辑模型MGIE:
它可以通过文字提示来编辑任何图像。
你只需要描述你想对图像进行如何的编辑操作,它就能帮你自动编辑完成,无需复杂的手动编辑过程。比如说,“让天空变成粉红色”,或者“在这张照片中加一个恐龙”。 它可以实现改变颜色、添加物体或调整、移除图片中的某些元素等操作。
 
工作原理:
MGIE通过结合多模态大语言模型(MLLM)和图像编辑模型,实现基于指令的图像编辑。 用户提供自然语言指令,MGIE利用MLLM理解这些指令的视觉含义,并将其转换为具体的图像编辑任务。 然后,编辑模型根据这些指令对图像进行修改,通过端到端训练同时捕获视觉想象和执行操作,提高编辑的准确性和一致性。
 
主要功能特点:
1、基于指令的图像编辑:
MGIE允许用户通过简单的文本指令来修改图像,例如改变物体的颜色、添加或移除图像中的元素等,无需复杂的手动编辑过程。
2、自然语言理解:
通过整合多模态大语言模型(MLLM),MGIE能够理解和解析自然语言中的编辑指令,将用户的描述转化为具体的图像编辑动作。
3、视觉和文本信息的整合:
MGIE结合了视觉信息和文本指令,利用MLLM在理解指令的同时考虑图像的上下文,实现更准确和符合用户意图的编辑结果。
4、端到端的训练:
MGIE通过端到端的训练方法,联合学习图像编辑模型和语言模型,以提高编辑任务的准确性和一致性。 5、MGIE适用于Photoshop风格的修改、全局照片优化和局部编辑等多种图像编辑任务,展现了其广泛的适用性和灵活性。
 
 
7⃣️
📱 Mobile Diffusion:Google 开发的手机上的图像生成模型:
  • 仅520M大小,适合在手机上运行。
  • 根据文字提示快速生成高分辨率图片。
 
 
 
小互日报-2 月 6 日小互日报-2 月 4 日