Нужен совет какой подход использовать ML (NLP)
Имеется датасет на 1500 записей, 40 классов, не очень то уж и сбалансированный.
для обучения использовал sklearn модели, и они давали результат +- 0.85acc. текс разбивал на токены, убирал стоп слова и всякие знаки пунктуации.
Хочу как-то улучшить качество классификации до 0.9 , но не знаю каким бы образом это сделать и реально ли такое при таком маленьком датасете.
Источник: Stack Overflow на русском