以图搜图
以图搜图
以图搜图,是通过搜索图像文本或者视觉特征,为用户提供互联网上相关图形图像资料检索服务的专业搜索引擎系统,是搜索引擎的一种细分。通过输入与图片名称或内容相似的关键字来进行检索,另一种通过上传与搜索结果相似的图片或图片URL进行搜索。
产生原因
以图搜图 互联网上图像的数据信息日渐庞大,用户对网上图像搜索的要求也在不断提高,使各种基于Web的图像搜索引擎应运而生。图像搜索引擎的出现,使我们对网上图像信息的搜索变得非常简单,尽管还不很完美,却已经可以满足我们的大多数需求。
使用方法
一、上传本地图片
二、输入图片URL地址
用户通过上传图片或输入图片的url地址,从而搜索到互联网上与这张图片相似的其他图片资源,同时也能找到这张图片相关的信息。
购物搜索引擎也是通过上传图片或输入图片的url地址,搜索到全网同款和相似的商品。
工作原理
图像搜索引擎需要为在Web上浏览过的图像建立索引信息,能够进行图像分析和判别,为图像加注释,存储抽取出的索引信息建立索引库,理想的图像搜索引擎还应该能支持基于内容的图像检索。
1、自动查找图形文:可以通过两个HTML标签,即IMG SRC和HREF来检测是否存在可显示的图像文件,IMG SRC表示“显示下面的图像文件”,而HREF则表示“下面是一个链接”,这两种标签经常导向一个图像文件。搜索引擎通过检查文件扩展名来判断链接的是否是图像文件。如果文件扩展名是.GIF或.JPG,那它就是一个可显示的图像。
2、人工干预找出图像并进行分类:即人工对网上的图像及站点进行选择。这种方法可以产生准确的查询体系,但劳动强度太大,限制了处理图像的数量。由于图像不同于文本,需要人们按照各自的理解来说明其蕴含的意义,因此图像检索比起文本的查询和匹配要困难得多。图像搜索引擎大多支持关键词检索和分类浏览两种检索方式,部分可提供可视属性检索,但也很有限。它们主要的检索途径有以下几种:
a. 基于图像外部信息:即根据图像的文件名或目录名、路径名、链路、ALT标签以及图像周围的文本信息等外部信息进行检索,这是图像搜索引擎采用最多的方法。在找出图像文件后,图像搜索引擎通过查看文件名或路径名确定文件内容,但这取决于文件名或路径名的描述程度。
b. 基于图像内容特征描述:这是一种语义层次的匹配。需要人工对图像的内容(如物体、背景、构成、颜色特征等)进行描述并分类,给出描述词。检索时,将主要在这些描述词中搜索你的检索词。这种查询方式是比较准确的,一般来讲可以获得较好的查准率。但需人工参与,劳动强度大,因而限制了可处理的图像数量,并且需要一定的规范和标准,效果取决于人工描述的精确度。
c. 基于图像形式特征的抽取:由图像分析软件自动抽取图像的颜色、形状、纹理等特征,建立特征索引库,用户只需将要查找的图像的大致特征描述出来,就可以找出与之具有相近特征的图像。这是一种基于图像特征层次的机械匹配,特别适用于检索目标明确的查询要求(例如对商标的检索)。产生的结果也是最接近用户要求的。但这种较成熟的检索技术主要应用于图像数据库的检索,在网上图像搜索引擎中应用这种检索技术还具有一定的困难。