Descrição do BIRSE - ImageSearch
O novo serviço do site de comparação de preços BigGo, BIRSE, marca um avanço significativo na recuperação de informações. Essencialmente, o BIRSE é um sistema de “busca visual” com uma distinção substancial em sua filosofia de design, apresentação de resultados e compreensão geral em comparação com o que a maioria das pessoas comumente percebe como “pesquisa de imagens”.
Um novo avanço
O BIRSE baseia-se em ferramentas generativas, estabelecendo um modelo de aprendizagem de amostra zero que combina texto e imagens. Este inovador sistema de busca de imagens, assim como os renomados Vision Language Models (LLMs), possui recursos de "compreensão de imagens". Vai além das meras aparências e cores, permitindo identificar imagens com significado compartilhado. Isso inclui características como textura e estilo de um item, resolvendo a complexidade de expressar certos atributos em palavras que as pesquisas de imagens padrão não conseguem analisar.
Cenários de aplicação
No passado, o uso do mecanismo de busca BigGo exigia a inserção de palavras-chave para consultar e comparar produtos. Embora esta abordagem seja adequada para itens com especificações explícitas, como componentes de computador e eletrônicos, ela é menos eficaz para moda, móveis ou objetos com vários estilos e materiais que são difíceis de descrever textualmente.
Orientação do Produto
Outro desafio é que os resultados da pesquisa, especialmente de conteúdo relacionado à moda, muitas vezes levam a bancos de dados de imagens e fotos de roupas de influenciadores. Encontrar opções de compra direta nas plataformas de compras costumava ser limitado ou mesmo impossível. Antes da introdução do BIRSE, outros sistemas de pesquisa de imagens ofereciam funcionalidades semelhantes, mas a sua escala e precisão de pesquisa não eram particularmente notáveis. Com os modelos de parâmetros substanciais do BigGo e um banco de dados de 500 milhões de produtos locais, pretendemos aprimorar os recursos deste aplicativo e ajudar os usuários a localizar rapidamente os produtos desejados.
Um novo avanço
O BIRSE baseia-se em ferramentas generativas, estabelecendo um modelo de aprendizagem de amostra zero que combina texto e imagens. Este inovador sistema de busca de imagens, assim como os renomados Vision Language Models (LLMs), possui recursos de "compreensão de imagens". Vai além das meras aparências e cores, permitindo identificar imagens com significado compartilhado. Isso inclui características como textura e estilo de um item, resolvendo a complexidade de expressar certos atributos em palavras que as pesquisas de imagens padrão não conseguem analisar.
Cenários de aplicação
No passado, o uso do mecanismo de busca BigGo exigia a inserção de palavras-chave para consultar e comparar produtos. Embora esta abordagem seja adequada para itens com especificações explícitas, como componentes de computador e eletrônicos, ela é menos eficaz para moda, móveis ou objetos com vários estilos e materiais que são difíceis de descrever textualmente.
Orientação do Produto
Outro desafio é que os resultados da pesquisa, especialmente de conteúdo relacionado à moda, muitas vezes levam a bancos de dados de imagens e fotos de roupas de influenciadores. Encontrar opções de compra direta nas plataformas de compras costumava ser limitado ou mesmo impossível. Antes da introdução do BIRSE, outros sistemas de pesquisa de imagens ofereciam funcionalidades semelhantes, mas a sua escala e precisão de pesquisa não eram particularmente notáveis. Com os modelos de parâmetros substanciais do BigGo e um banco de dados de 500 milhões de produtos locais, pretendemos aprimorar os recursos deste aplicativo e ajudar os usuários a localizar rapidamente os produtos desejados.
Mostrar