Step 1. Add the JitPack repository to your build file
Add it in your root settings.gradle at the end of repositories:
dependencyResolutionManagement {
repositoriesMode.set(RepositoriesMode.FAIL_ON_PROJECT_REPOS)
repositories {
mavenCentral()
maven { url 'https://jitpack.io' }
}
}
Add it in your settings.gradle.kts at the end of repositories:
dependencyResolutionManagement {
repositoriesMode.set(RepositoriesMode.FAIL_ON_PROJECT_REPOS)
repositories {
mavenCentral()
maven { url = uri("https://jitpack.io") }
}
}
Add to pom.xml
<repositories>
<repository>
<id>jitpack.io</id>
<url>https://jitpack.io</url>
</repository>
</repositories>
Add it in your build.sbt at the end of resolvers:
resolvers += "jitpack" at "https://jitpack.io"
Add it in your project.clj at the end of repositories:
:repositories [["jitpack" "https://jitpack.io"]]
Step 2. Add the dependency
dependencies {
implementation 'com.github.stagirs:lingvo:-SNAPSHOT'
}
dependencies {
implementation("com.github.stagirs:lingvo:-SNAPSHOT")
}
<dependency>
<groupId>com.github.stagirs</groupId>
<artifactId>lingvo</artifactId>
<version>-SNAPSHOT</version>
</dependency>
libraryDependencies += "com.github.stagirs" % "lingvo" % "-SNAPSHOT"
:dependencies [[com.github.stagirs/lingvo "-SNAPSHOT"]]
Для обновления необходимо выкачать актуальные словарь dict.opcorpora.xml.zip и разметку annot.opcorpora.no_ambig.xml.zip OpenCorpora и подложить их в корень проекта:
Для получение морфологической информации для слова из словаря используется метод com.github.stagirs.lingvo.morph.MorphAnalyzer.get(word).
Для предсказания морфологической информации для слова не из словаря используется метод com.github.stagirs.lingvo.morph.MorphPredictor.get(word).
В результате выполнения методов MorphAnalyzer.get(word) и MorphPredictor.get(word) возвращается объект Morph.
Из объекта Morph может быть получено:
По индексу нормальной формы:
Для выделения предложений в тексте используется метод com.github.stagirs.lingvo.syntax.SentenceExtractor.extract(text).
Для итерации по текстам с выделением предложений используется класс com.github.stagirs.lingvo.syntax.SentenceIterator.
При выделении предложений может возникнуть неоднозначность в определении правильного морф. описания того или иного слова. Класс com.github.stagirs.lingvo.syntax.DisambiguityProcessor поможет решить эту проблему. С помощью метода DisambiguityProcessor.process(sentence) для каждого неоднозначного слова в предложении sentence каждому варианту морф. информации ставится в соответствие вес, отражающий его совместимость с предложением sentence. Далее для разрешения неоднозначности будет выбран вариант с наибольшим весом.