Minhas impressões do livro “Text Mining with R: a tidy approach” da Julia Silge and David Robinson.
Mineração de texto (ou text mining) e PLN (processamento da linguagem natural) não são minhas linhas de pesquisa, mas a raíz de um dos projetos do grupo de pesquisa BDAQ fiquei ainda mais curioso sobre como analisar texto.
Foi assim que resolvi ler alguns livros sobre o assunto, sendo o primeiro deles o livro Text Mining with R: a tidy approach
de Silge and Robinson (2017), que pode ser livremence acessado aqui e do qual trago algumas pequenas impressões para os alunos interessados no assunto.
O livro possui uma versão impressa e pode ser adquirido aqui, mas os autores gentilmente disponibilizaram a versão online para ser acessada de forma gratuita aqui (sim, eu fui na gratuita!).
O livro é uma introdução rápida e prática à mineração de texto, traz vários exemplos que podem ser facilmente reproduzidos através do código disponibilizado no próprio livro e apresenta diversos exemplos nos quais mineração de texto pode ser utilizada. Isto todo, utilizando o software R
e alguns pacotes tais como tidytext
, wordcloud
, ggraph
, entre muitos outros.
R
pertence ao mundo tidyverse
, o capítulo 5 apresenta como transitar entre os diferentes formatos utilizados para armazenar dados de texto de forma fácil e simples. Isto permite que seja possível utilizar diferentes pacotes destinados à análise de texto sem maiores preocupações.Guru
em mineração de texto.Supervised Machine Learning for Text Analysis in R
(Hvitfeldt and Silge 2021) que está disponibilizado livremente aqui e Textual Data Science with R
(Bécue-Bertaut 2019)Se você gostar do R assim como eu, os códigos no livro serão muito úteis. Contudo, se você preferir alguma outra linguagem como Python ou Julia, o livro continua sendo útil e você pode focar em entender os conceitos e os exemplos de aplicação, bastando apenas como implementar os métodos na linguagem de preferência (devem existir diversas fontes onde pode encontrar isso.)
Happy Coding!
For attribution, please cite this work as
Trucíos (2022, March 14). Carlos Trucíos: Book Review: Text Mining with R. Retrieved from https://ctruciosm.github.io/posts/2022-03-14-book-review-text-mining-with-r/
BibTeX citation
@misc{trucíos2022book, author = {Trucíos, Carlos}, title = {Carlos Trucíos: Book Review: Text Mining with R}, url = {https://ctruciosm.github.io/posts/2022-03-14-book-review-text-mining-with-r/}, year = {2022} }