工学 >>> 计算机科学技术 >>> 计算机科学技术基础学科 人工智能 计算机系统结构 计算机软件 计算机工程 计算机应用 计算机科学技术其他学科
搜索结果: 1-15 共查到计算机科学技术 模态相关记录77条 . 查询时间(0.191 秒)
2024年9月19日,中国科学院地理科学与资源研究所正式发布该单位联合中国科学院青藏高原研究所、自动化研究所等单位研发的多模态地理科学大模型“坤元”(Sigma Geography)。
2024年9月19日,中国科学院地理科学与资源研究所联合中国科学院青藏高原研究所、中国科学院自动化研究所等单位研发的多模态地理科学大模型“坤元”(Sigma Geography)正式发布。
语音音频技术是人工智能的重要分支,它让计算机能够理解和生成人类的语音和各种音频,实现与人类自然、流畅、高效的交互。随着多模态大模型的不断发展,语音音频技术正面临前所未有的发展机遇,同时也伴随一系列挑战。本论坛将聚焦语音音频技术在新一代人工智能及多模态大模型背景下的发展趋势和前沿问题,从语音及音频理解、语音音频与多模态大模型结合、面向AIGC的语音及音频生成、相关技术在人机交互服务中的应用等方面展开...
2024年9月9日,中国科学院合肥物质院智能所先进制造中心王红强研究员团队提出一种宽域跨模态机器视觉AI模型,突破了传统单域模型跨模态信息处理瓶颈,实现了跨模态图像检索技术新突破。该研究成果被计算机视觉顶会(欧洲计算机视觉大会,ECCV2024)正式接收。
自然界中的软体生物对其颜色、对比度以及形状有着惊人的自主控制能力。它们通过动态的身体图案及生物发光实现同类之间的信息交流、伪装、保护和预警,以适应复杂多变的自然环境。一个典型的例子是警报水母,当其感知到海洋猎食者袭击并受伤时,会发出耀眼的光芒以吸引更大的猎食者来消灭眼前的侵略者。这种兼具有感知、识别、自适应和保护的水下环境交互能力有助于探索水下神秘环境及新物种,从而为水下活动的开展提供丰富且必要的...
为激发科研兴趣、拓展科研思路,搭建师生科研交流平台,2024年5月24日下午,凤翔书院在物理与光电工程学院1111会议室举办2024年第17期凤翔科研沙龙,邀请信息与通信工程学院教授、博士生导师、副院长、海南省自由贸易港高层次人才胡祝华及其科研团队入驻书院,开展《多模态信息智能处理与决策管控团队》主题沙龙。凤翔书院党委书记王华伟、副书记郭孝伟、就业辅导员卢茜出席,共30余名师生参加本次沙龙。
在国家自然科学基金项目(批准号:62133012、61936006)等资助下,西安电子科技大学赵伟教授团队的研究成果“可信冲突多模态学习算法(Reliable Conflictive Multi-view Learning)”获AAAI-24最佳论文奖。2024年来,利用多模态信息提升模型决策置信度成为可信人工智能的热门研究方向。传统多模态可信融合学习无法处理模态间的决策冲突,导致实际应用时效果反...
2024年1月18日,CCF TF第99期“AIGC时代的多模态知识图谱构建与应用”以线上会议形式成功举办。本次活动由CCF TF知识图谱SIG策划呈现,邀请了阿里、蚂蚁等互联网企业的代表,以及来自哈尔滨工业大学的研究人员,一起围绕AIGC时代多模态知识图谱构建与应用这个话题,分享典型的多模态知识图谱构建与应用的关键技术、典型案例与最佳实践。
2023年2023年11月10-11日,由中国人工智能学会(CAAI)主办,CAAI智能服务专委会、无损检测与光电传感技术及应用国家工程实验室、图像处理与模式识别江西省重点实验室、无损检测技术教育部重点实验室联合承办,南昌航空大学协办的“2023多模态智能信息处理技术与智能服务论坛”在江西南昌顺利召开,200余人在线下参加了本次会议。论坛邀请了北京大学查红彬教授、中国科学院计算技术研究所陈熙霖研究...
本发明涉及一种融合视频多模态内容的人物可视化方法及装置。该方法包括:抽取目标视频在各模态下的原始数据;依据各模态下抽取的原始数据的最小尺度,对齐各模态下的原始数据;基于对齐后的各模态下的原始数据,在设定尺度范围内依据不同模态特性提取模态特征数据;基于提取的模态特征数据,针对视频摘要的可视化形式进行人物可视化,并针对视频播放器的可视化形式进行人物可视化;基于视频播放器的可视化形式,进行视频播放及播放...
2023年10月12日,中国科学技术大学工程科学学院机器人与智能装备研究所董二宝副教授课题组发布了首个面向高空作业机器人的开源多模态感知数据集USTC FLICAR。该数据集以“USTC FLICAR: A sensors fusion dataset of LiDAR-inertial-camera for heavy-duty autonomous aerial work robots”为题在...
2023年6月16日,在人工智能框架生态峰会2023上,中国科学院自动化研究所所长徐波正式发布“紫东太初”全模态大模型。
现有多模态机器翻译(Multi-modal machine translation,MMT)方法将图片与待翻译文本进行句子级别的语义融合.这些方法存在视觉信息作用不明确和模型对视觉信息不敏感等问题,并进一步造成了视觉信息与文本信息无法在翻译模型中充分融合语义的问题.针对这些问题,提出了一种跨模态实体重构(Cross-modal entity reconstruction,CER)方法.区别于将完整...
2023年5月18日上午,广东省重点领域研发计划新一代人工智能专项项目《多模态智能机器人视觉感知与人机交互关键技术研究及应用示范》(编号:2018B010108002)验收会在软件学院B7栋303室举行。广东省科学技术厅专家王欢与商惠敏,验收专家暨南大学张银炎教授等五人,华南理工大学科研院副处长韩双艳,软件学院副院长刘飞教授,项目负责人闵华清教授与吴庆耀教授,项目核心骨干人员朱金辉副教授以及各企业...
2023年5月11日,CCIG2023技术论坛“多模态情感计算技术与应用”在江苏省苏州市狮山国际会议中心太湖C厅成功举行。本次论坛由中国图象图形学学会(CSIG)主办,CSIG情感计算与理解专委会和CSIG机器视觉专委会承办、儿童发展与学习科学教育部重点实验室(东南大学)和南京工程学院计算机工程学院协办。论坛由东南大学郑文明教授和南京工程学院黄晓华教授担任共同主席。此次论坛邀请到了六位业内知名教授...

中国研究生教育排行榜-

正在加载...

中国学术期刊排行榜-

正在加载...

世界大学科研机构排行榜-

正在加载...

中国大学排行榜-

正在加载...

人 物-

正在加载...

课 件-

正在加载...

视听资料-

正在加载...

研招资料 -

正在加载...

知识要闻-

正在加载...

国际动态-

正在加载...

会议中心-

正在加载...

学术指南-

正在加载...

学术站点-

正在加载...