您当前位置: 首页 > 产品中心

昨夜今晨:阿里达摩院上线文本生成视频模型 Adobe发布文字生成图像AI工具

来源:爱游戏    发布时间:2024-03-16 03:21:33

  阿里达摩院已在 AI 模型社区魔搭ModelScope 上线了文本生成视频大模型。根据官方介绍,目前文本生成视频大模型,由文本特征提取、文本特征到视频隐空间扩散模型、视频隐空间到视频视觉空间这 3 个子网络组成,整体模型参数约 17 亿,目前仅支持英文输入。扩散模型采用 Unet3D 结构,通过从纯高斯噪声视频中,迭代去噪的过程,实现视频生成的功能。官方介绍称,本模型适合使用的范围较广,能基于任意英文文本描述进行推理,生成视频,该模型在创空间和 huggingface 上线,可以直接体验,也可以借鉴该页面自行搭建。模型需要硬件配置大约是 16GB 内存和 16GB GPU 显存。

  著名的创意软件公司Adobe在美国洛杉矶发布了其生成式AI工具Firefly,可由文字内容生成图像内容。据了解,目前 Firefly 只能在 Adobe 的网站上使用,但公司计划将其集成到其软件中,从其 Photoshop 图像编辑软件、Illustrator 设计软件和 Adobe Express 快速视频制作软件开始。该公司尚未透露新工具的定价。Adobe认为,AI工具的出现不会取代人类设计师,而是会提升他们的竞争力和创造力。公司还注意到了人工智能可能带来的法律和社会问题,比如版权侵权、偏见和刻板印象。因此,Adobe 使用了自己的图库、公共领域和授权作品来训练 Firefly,并避免了使用有版权、有商标或有敏感内容的图像。

  清华大学顶尖的 NLP 团队日前公开了自研的类 ChatGPT 的大模型 —— 中英双语对话模型 ChatGLM-6B,初具问答和对话功能,现已开启邀请制内测(内测申请网址 ),后续还会逐步扩大内测范围。官方博客中提到,这是一个初具问答和对话功能的千亿中英语言模型,并针对中文进行了优化。该团队称,一直在探索、尝试和努力,GLM 系列模型取得了一丝进展,但离国际顶尖大模型研究和产品都还有明显差距。中国大模型研究在原创算法、AI 芯片和产业上的追赶与突破需要大家的一起努力,更要求我们对下一代 AI 人才的培养与锻炼。

  据天津公布消息,第七届世界智能大会将于5月18日在国家会展中心(天津)举办。英国担任第七届世界智能大会主宾国。目前已有国内企业阿里巴巴、中国联通、中国通用、浪潮、同方股份、TCL、云账户、忽米科技、卓朗科技、工商银行和中国银行,国际企业史赛克、朝亚和碧迪医疗等企业意向确认参展,大会组委会在展会期间将首次推出专业观众买家团团组计划、双边会谈、人才对接双选会等多个配套服务活动。

  在腾讯财报发布的电话会议中,腾讯高管表示,生成式AI可拿来提升腾讯旗下旗舰产品的使用者真实的体验。未来可能每一个用户都会有人工智能助理,如果效果好,有可能将生成式AI纳入微信和QQ。

  联想日前宣布将与英伟达联合研发最新一代车载域控制器平台。联想官方表示,最新一代车载域控制器平台是基于新一代 NVIDIA DRIVE Thor 系统级芯片打造的联想车计算高端核心产品线 年初量产。NVIDIA DRIVE Thor 拥有最高每秒 2000 万亿次浮点运算性能,以及高度集成的前瞻性 AI 智能技术,能够给大家提供下一代软件定义车辆所需的尖端 AI 功能、性能和冗余。

  高德日前召开内部会议,宣布和阿里旗下本地生活的到店业务口碑正式合并。未来,阿里巴巴旗下所有的本地生活到店业务将统一整合在高德地图的入口中。高德官方证实了这一消息,并表示作为出门好生活开放服务平台的高德地图始终致力于为用户更好的提供哪儿都熟的到目的地服务。新团队加入将有利于我们为用户和生态合作伙伴提供更好的到目的地服务。

  腾讯控股发布了 2022 年第四季度及全年财报。财报显示,2022年全年,腾讯营收 5545.52 亿元,同比降低1%,净利润 1882.43 亿元,同比降低 16%非国际财务报告准则下,净利润 1156.49 亿元,同比降低 7%。公告称,截至去年四季度末,微信及 WeChat 的合并月活跃账户数 13.13 亿,同比增长 3.5%;QQ移动终端月活 5.72 亿,同比增长 3.6%。

  知乎今日发布截至 2022 年 12 月 31 日止年度业绩公告。财报显示,知乎第四季度实现盈利收入 11.14 亿元,同比增长 9.3%,净亏损 1.8 亿元,同比收窄 53.2%;2022 年营收 36.05 亿元,同比增长 21.8%。

相关案例查看更多