凯发·k8(国际) - 官方网站

解决方案 广告标识 板卷通用解决方案 智能分拣解决方案 软膜大幅面解决方案 板材送切收流水线 印刷包装 印刷包装打样解决方案 印刷包装小批量解决方案 纺织服装 服装高级定制智能裁剪解决方案 团体职业装智能裁剪解决方案 运动内衣智能裁剪解决方案 复材工业 复合材料通用解决方案 复材送切收自动化流水线 数码标签 数码标签解决方案 裁切系统 CB03II系列纸箱打样机 CBD08系复材送切收自动化裁切流水线 TB10 高速广告裁切机 RC03II服装模板雕刻机 RSF-360标激光标签模切机 LST系列自动送切收数码模切机 EDO系列纸样切割机 凯发k8国际 广告标识 印刷包装 纺织服装 复材工业 数码标签 走进凯发k8 公司简介 领导风采 资讯中心 凯发k8官方动态 行业资讯 行业应用 裁切案例 产品资讯 联系凯发k8 凯发·k8(国际) - 官方网站

宁波凯发k8国际数控股份有限公司

裁切案例
凯发·k8(国际) - 官方网站
首页 > 资讯中心 > 裁切案例
凯发国际官网首页MSRA获ACM TOMM 2017最佳论文:让AI接手繁杂专业
2025-02-22 23:43:31 凯发k8国际数控

  论文的联合作者是杨绪勇(微软亚洲研究院和中国科技大学联合培养博士生ღ✿★ღ,喂车车联合创始人)至尊宝用金箍棒桶紫霞小鸡ღ✿★ღ、梅涛(微软亚洲研究院资深研究员ღ✿★ღ,美国计算机协会杰出科学家ღ✿★ღ,国际模式识别学会会士)至尊宝用金箍棒桶紫霞小鸡ღ✿★ღ、徐迎庆(前微软亚洲研究院主管研究员ღ✿★ღ,清华大学美术学院信息艺术设计系主任)ღ✿★ღ、芮勇(前微软亚洲研究院副院长凯发国际官网首页ღ✿★ღ,联想CTO)ღ✿★ღ、李世鹏(前微软亚洲研究院副院长ღ✿★ღ,硬蛋CTO)ღ✿★ღ。祝贺研究院的各位研究员和院友们ღ✿★ღ!

  当今富媒体的内容之多是前所未有的凯发国际官网首页凯发,凯发k8,K8ღ✿★ღ。ღ✿★ღ,人们每时每刻都在创造和分享着海量信息ღ✿★ღ,特别是内容繁杂的图像和文字信息ღ✿★ღ,其中图文混排的内容模式已经成为主流凯发国际官网首页ღ✿★ღ。而在内容创作过程中ღ✿★ღ,人们面临的一个巨大的挑战就是如何针对内容多样的图像和文字信息来设计吸引眼球的版面(例如ღ✿★ღ,杂志封面ღ✿★ღ、海报凯发国际官网首页ღ✿★ღ、或者PPT演讲稿等)ღ✿★ღ。这个问题无论是对于商业印刷ღ✿★ღ、在线期刊与杂志ღ✿★ღ,还是用户生成的内容表达ღ✿★ღ,都极为重要ღ✿★ღ。图文内容的排版涉及到大量的专业知识ღ✿★ღ,包括视觉传达ღ✿★ღ、信息艺术设计ღ✿★ღ、色彩与美学ღ✿★ღ、平面规划ღ✿★ღ、几何构图等等ღ✿★ღ。以往的图文排版设计工作凯发国际官网首页ღ✿★ღ,不仅需要具有丰富专业知识的设计师ღ✿★ღ,而且还耗费大量的人工ღ✿★ღ。如何让计算机根据图文内容来自动进行排版是一个非常困难的问题ღ✿★ღ。

  从2013年底开始ღ✿★ღ,来自微软亚洲研究院的研究员与来自清华大学美术学院的艺术设计专家至尊宝用金箍棒桶紫霞小鸡ღ✿★ღ,在这个科学与艺术相融合的领域开展了深入地合作ღ✿★ღ。他们把设计学中的审美原则与可计算的图像特征相结合雕刻裁切凯发国际ღ✿★ღ,ღ✿★ღ,创造性地提出了一个可计算的自动排版框架原型ღ✿★ღ。该原型通过对一系列关键问题的优化(例如凯发K8天生赢家一触即发ღ✿★ღ!ღ✿★ღ,嵌入在照片中的文字的视觉权重ღ✿★ღ、视觉空间的配重ღ✿★ღ、心理学中的色彩和谐因子ღ✿★ღ、信息在视觉认知和语义理解上的重要性等)ღ✿★ღ,把视觉呈现ღ✿★ღ、文字语义ღ✿★ღ、设计原则ღ✿★ღ、认知理解等领域专家的先验知识自然地集成到同一个多媒体计算框架之内ღ✿★ღ,并且开创了“视觉文本版面自动设计”这一新的研究方向ღ✿★ღ。

  图1 利用算法自动产生的图文排版效果ღ✿★ღ。注ღ✿★ღ:原始输入是一张纯图片(即没有任何文字)和一段纯文本(如主标题和副标题等)ღ✿★ღ,输出是图文混排的结果(文字嵌入图片之中)k8凯发国际官方入口ღ✿★ღ,ღ✿★ღ。

  这项研究将通用的美学感知进行了体系的数学表达ღ✿★ღ,构建了一套和主题相关的图文排版设计模版库ღ✿★ღ,并提出一套可计算的图文合成框架原型ღ✿★ღ,既融合了宏观层面自上而下的美学感知ღ✿★ღ,又包含了微观层面自下而上的图文特征至尊宝用金箍棒桶紫霞小鸡ღ✿★ღ。通过融合人脸ღ✿★ღ、文字检测以及视觉显著性检测算法ღ✿★ღ,率先提出了视觉注意力检测算法ღ✿★ღ,构成了整幅图像的重要性图和注意力图ღ✿★ღ;在针对文字布局的算法中ღ✿★ღ,这篇论文将文字块的形状和图像中的重要性图交互过程量化为一个能量最优化问题ღ✿★ღ:

  之间的不匹配ღ✿★ღ,即将最重要的文字内容匹配到图像中最重要的视觉区域ღ✿★ღ,以便于阅读时快速获得关键信息ღ✿★ღ。能量最优化的求解过程ღ✿★ღ,在设计模版的美学感知原则的监督下ღ✿★ღ,使得最后的求解结果能符合视觉审美需求ღ✿★ღ,而不仅仅是计算机的最优求解结果ღ✿★ღ。

  在文本空间布局后ღ✿★ღ,通过对图像前后景显著颜色的分析ღ✿★ღ,在色彩和谐最优化框架中ღ✿★ღ,保持色彩整体和谐ღ✿★ღ,并最大化文字和背景色彩的差异以使得最后的图文混排能在全局尊重原图的色彩和谐性ღ✿★ღ,又能在局部保证文字的可阅读性至尊宝用金箍棒桶紫霞小鸡凯发国际官网首页ღ✿★ღ。全局色彩的和谐计算采用了著名的“Color Harmonization”中提出的心理学色彩模型ღ✿★ღ,并结合了这篇论文中提出的图像前后景主题色在不同主题下的模型偏好ღ✿★ღ,从而找到最适合的全局主题色凯发国际官网首页ღ✿★ღ。针对局部的视觉对比度最大化ღ✿★ღ,论文提出了最远色调角黄金取样法ღ✿★ღ,即找到文本覆盖背景下图像的显著颜色映射到tone和hue空间ღ✿★ღ,在二维色调空间(tone, hue)求最远点ღ✿★ღ,并取显著颜色点到最远点的黄金分割点ღ✿★ღ。通过整个框架ღ✿★ღ,能完成整个图文设计在美学感知监督下的自动化ღ✿★ღ。

  这篇论文提出的系统允许用户上传具体主题的视觉背景图像以及一些文本语句ღ✿★ღ。并在第二阶段对原始图像进行了处理ღ✿★ღ,通过结合显著值ღ✿★ღ、脸部ღ✿★ღ、文本以及目光注意力图以获取视觉感知图ღ✿★ღ,进而重新调整图像的大小ღ✿★ღ,使之符合目标布局尺寸ღ✿★ღ,并根据视觉感知图保留重要的区域ღ✿★ღ。重新调整过的图像就能用来排列空间分布的布局模板ღ✿★ღ。当图像调整后ღ✿★ღ,已有的语句ღ✿★ღ、空间布局以及文本就通过第三阶段中的能源优化工艺重叠在背景图像上了ღ✿★ღ。在第四阶段的文本着色上ღ✿★ღ,首先分析经过剪裁的图像的调色板ღ✿★ღ,同时根据主题属性挑选主题色彩ღ✿★ღ。应用特定色相/色调模型ღ✿★ღ、调色板ღ✿★ღ、语义色彩以及内容特点ღ✿★ღ,就可以通过保持局部色彩和谐以及局部可读性对文本进行重新着色ღ✿★ღ。

  图3 布局算法(a)带有目光注意力(黄色)的视觉重要性图(灰色)ღ✿★ღ;(b)从前5个模板中挑选出的模板ღ✿★ღ;(c)输入文本ღ✿★ღ;(d)排印程序的细节ღ✿★ღ,这里能源定义为E(L)至尊宝用金箍棒桶紫霞小鸡至尊宝用金箍棒桶紫霞小鸡ღ✿★ღ,通过迭代控制字体高度ღ✿★ღ,在局部优化解决方案中会被最小化ღ✿★ღ,ღ✿★ღ;(e)受到下向上的图像特点和自上向下的空间布局限制的排印结果ღ✿★ღ。

  这篇论文发表之后ღ✿★ღ,得到学术界的广泛关注ღ✿★ღ,从2016年至今在ACM数据库中已有超过260次下载ღ✿★ღ。此外ღ✿★ღ,该项研究不仅具有重要的理论意义ღ✿★ღ,而且具有广泛的应用价值ღ✿★ღ。例如ღ✿★ღ,论文提出的基于图像内容的颜色检测算法已经在实际产品Office Sway中得到应用ღ✿★ღ。目前每个月有来自全球60多个国家的超过40多万用户在使用Office Sway这一新产品开展设计ღ✿★ღ。

  这篇论文展现了多媒体与艺术设计以及颜色心理学几个不同学科的深度融合ღ✿★ღ,将人工智能的方法用于艺术设计中ღ✿★ღ。可以说ღ✿★ღ,颜色心理学的模型为多媒体设计打开了”心灵“的窗口至尊宝用金箍棒桶紫霞小鸡ღ✿★ღ,而美学设计思维则为多媒体分析展开了想象的翅膀ღ✿★ღ!

  另外ღ✿★ღ,还特别感谢这篇论文的合作者——来自中国科技大学的博士生吴岳和来自清华美术学院的研究生于俊杰ღ✿★ღ。