Перцептивна модифікація метода N-грам для оцінювання схожості послідовностей символів за коефіцієнтом Серенсена

Authors

  • Д. С. Савченко

Abstract

У статті запропоновано модифікацію методу N-грам з використанням коефіцієнту Серенсена для кількісної оцінки схожості послідовностей символів, що відповідає сформованому критерію і дозволяє оцінювати схожість послідовностей символів з урахуванням особливості їх сприйняття людиною експертом (принципу перцептивності). Запропонований метод дозволяє будувати більш ефективні механізми автоматизованого виявлення та корегування помилок у неструктурованих текстах.

Ключові слова: послідовність символів, коефіцієнтом Серенсена, метод N-грам, принцип перцептивності, дистанція між послідовностями символів, схожість послідовностей

Published

2016-07-02

Issue

Section

Articles