Witam, interesuje mnie jak mogę zwiększyć skuteczność uczenia na podstawie zbioru dokumentów? Chciałbym wyciągać linie ze słowami kluczowymi bądź pokrewnymi do tych które podam w Word2Vec implementowanym w Javie.
Obecnie tworzony przeze mnie obiekt Word2Vec wygląda w ten sposób, mój zbiór danych po którym iteruje ma ok. 50 dokumentów, jednak wyniki pokrewieństwa wyrazów na podstawie nauki, nie są idealne, są jakieś sposoby poza zwiększeniem zbioru danych, na zwiększenie skuteczności?
Przykład 5 najbliższych wyrazów pokrewnych dla słowa doświadczenie [zasobami, dziedzinie, firmach, prezentacji, masowa]
vec = new Word2Vec.Builder()
.minWordFrequency(1)
.iterations(1)
.layerSize(100)
.seed(42)
.windowSize(5)
.iterate(sentenceIterator)
.tokenizerFactory(tokenizerFactory)
.build();
vec.fit();
macie jakieś pomysły?