文本、图像、点云任意模态输入,AI能够一键生成高质量CAD模型了
发布时间:2024-11-25 15:43
发布者:网络
浏览次数:☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com
本文第一作者为上海科技大学信息学院硕士生徐京伟和忆生科技的王晨宇,指导老师为香港大学的马毅教授和高盛华教授。王晨宇毕业于上海科技大学并获得工学硕士学位。其所在的忆生科技由马毅教授于 23 年底创立,致力于打造完整、自主、自洽的机器智能系统。
该项目由忆生科技联合香港大学、上海科技大学共同完成,是全球首个同时支持文本描述、图像、点云等多模态输入的计算机辅助设计(CAD)生成大模型。
Yaara
使用AI生成一流的文案广告,电子邮件,网站,列表,博客,故事和更多…
95
查看详情
计算机辅助设计(Computer-Aided Design,简称 CAD)软件是工业软件的重要分支,也是工业设计流程中的核心工具。然而,目前的 CAD 软件普遍缺乏简易的交互工具,这在一定程度上限制了未曾接触过 CAD 的用户尝试和探索的可能性。对于 CAD 建模从业者而言,多模态大模型技术的快速发展尚未充分转化为 CAD 领域实际应用的便利性和效率提升。如果能够通过多模态交互工具有效优化建模流程,提升效率、节约时间与精力,不仅可以进一步释放专业用户的创造潜能,还将为相关产业的发展注入新的活力。
为应对这一挑战,项目团队构建了首个覆盖文本、图像和点云输入的多模态 CAD 数据集 Omni-CAD。该数据集致力于赋能多模态大语言模型,使其能够基于条件输入生成高质量的 CAD 模型。与此同时,针对 CAD 模型的拓扑质量、空间封闭性等核心属性,团队还设计了一系列创新的评估指标,为模型性能提供更全面的衡量标准。借助这一技术,用户只需输入简单的文本指令,或上传目标形状的图像,即可快速生成符合要求的 CAD 模型。这一突破不仅降低了非专业用户的使用门槛,激发了更多人参与 CAD 设计的兴趣,还为 CAD 建模从业者提供了高效可靠的工具支持。

论文标题:CAD-MLLM: Unifying Multimodality-Conditioned CAD Generation With MLLM 论文地址:https://arxiv.org/pdf/2411.04954 项目主页:https://cad-mllm.github.io/




CAD 模型大多数生成结果都能保持严格的流形结构,没有出现悬边,具有较高的拓扑完整性。相比之下,基准模型在重建结果中往往存在许多悬空边缘(如图中蓝线所示)。





以上就是文本、图像、点云任意模态输入,AI能够一键生成高质量CAD模型了的详细内容,更多请关注其它相关文章!
# 工程
# omni-cad
# git
# qq
# ai
# 邮箱
# follow
# design
# gling
# type
# 高质量
# 模态
# 一键
# 多模
# 首个
# 这一
# 提出了
# 保时捷
# 三种
# 华纳
# 新北网站优化可靠吗
# seo sem营销
# 韶关网站营销推广公司
# 澳洲网站建设公司文案
# 保定seo关键词排名优化服务
# 获客网站优化介绍模板
# 亦庄什么是网站优化
# 政府网站建设制作设计
# 靠谱的网站建设产品
# 上海新媒体营销推广




