H-sim: a hybrid similarity function for product matching
DOI:
https://doi.org/10.5335/rbca.v16i1.14955Keywords:
electronic invoices, product matching, semantic similarity, similarity functions.Abstract
When a company purchases products from its suppliers, it needs to import electronic invoices for these products into its relational database to manage product inventory, taxes, and resale. This is not a trivial task, as the product descriptions in the invoices and the database vary. This paper proposes the H-sim similarity function that combines semantic similarity functions with similarity functions based on token or edit distance to identify products matching from different databases. Experiments were carried out using real product data, where the H-sim function obtained 87.7% of F1.
Downloads
Download data is not yet available.
Downloads
Published
2024-05-01
Issue
Section
Original Paper
License

This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.

Todos os artigos estão licenciados com a licença Creative Commons Atribuição-NãoComercial-SemDerivações 4.0 Internacional. Autores que publicam nesta revista concordam com os seguintes termos:
a) Autores mantém os direitos autorais e concedem à revista o direito de primeira publicação, com o trabalho simultaneamente licenciado sob a Licença Creative Commons Attribution que permite o compartilhamento do trabalho com reconhecimento da autoria e publicação inicial nesta revista.
b) Autores têm autorização para assumir contratos adicionais separadamente, para distribuição não-exclusiva da versão do trabalho publicada nesta revista (ex.: publicar em repositório institucional ou como capítulo de livro), com reconhecimento de autoria e publicação inicial nesta revista.
c) Autores têm permissão e são estimulados a publicar e distribuir seu trabalho online (ex.: em repositórios institucionais ou na sua página pessoal) a qualquer ponto antes ou durante o processo editorial, já que isso pode gerar alterações produtivas, bem como aumentar o impacto e a citação do trabalho publicado (Veja O Efeito do Acesso Livre).
How to Cite
[1]
2024. H-sim: a hybrid similarity function for product matching. Brazilian Journal of Applied Computing. 16, 1 (May 2024), 50–63. DOI:https://doi.org/10.5335/rbca.v16i1.14955.