hi,大家好~我是shadow,一枚设计师/全栈工程师/算法研究员,目前主要研究方向是人工智能写作和人工智能设计,当然偶尔也会跨界到人工智能艺术及其他各种AI产品。这是我发在《人工智能Mix》的一篇论文阅读笔记。
1 What Looks Good with my Sofa: Multimodal Search Engine for Interior Design2 DeepStyle: Multimodal Search Engine for Fashion and Interior Design该文提出了一种视觉+文字查询的室内设计多模搜索引擎。
- 技术架构
引擎的目标是检索与查询具有视觉和美学相似性的室内物品,例如家具或挂钟。该搜索引擎用户可以上传拍摄的房间照片进行查询,检索与照片中存在的或视觉相似的项目列表。- word2vec Continuous Bag-of-Words (CBOW)及 LSTM 提取文本特征由于这方面没有公开的数据集,于是作者爬取了IKEA的 298 张卧室照片和描述, 以及2193 张产品照片和描述。此外,它还可以推荐在美学和风格上适合搭配的其他物品。论文作者提出,由于采用了这种混合策略,检索到的物品的风格相似性得分提高了11%。
论文原文,可在下方知识星球下载:
《人工智能MIX+》
本星球将分享人工智能的相关内容,包括AI产品、AI技术、AI场景、AI投资事件、AI的思维方式等。
限时优惠中,仅限前290名。
越早加入越划算。
人工智能时代,人与人之间多差距,体现在AI使用能力上。