Skip to content

Latest commit

 

History

History
3 lines (3 loc) · 452 Bytes

File metadata and controls

3 lines (3 loc) · 452 Bytes

NLP_SPAM

Решена задача классификации сообщений со спамом. В ходе работы я сравнил способы векторизации: CountVectorizer, TFIDFVrctorizer. Обучил модели: sklearn.tree.DecisionTreeClassifier, sklearn.linear_model.LogisticRegression, NaiveBayes с подбором гиперпараметров и сравнил скор на кросс - валидации.