CASI009 - Ciência de Dados 2
Carga horária: 45 horas-aula (3 créditos)
Ementa: Técnicas de Recuperação de Informação, Processamento de Linguagem Natural, Classificação de documentos, Análise de Sentimentos, Modelos de Linguagem, Análise de Semântica Latente, Link Analysis e Redes Complexas, Big Data, Sistemas de recomendação, Tópicos especiais.
Bibliografia:
-
BAEZA-YATES, R.; RIBEIRO-NETO, Berthier. Modern information retrieval: the concepts and technology behind search. 2nd ed. Harlow: Addison-Wesley, 2011. xx, 913 p. ISBN 9780321416919.
- MANNING, Christopher D.; RAGHAVAN, Prabhakar; SCHUTZE, Hinrich. Introduction to information retrieval. New York: Cambridge University Press, 2008. xxi, 482 p. ISBN 9780521865715.
- MITCHELL, T. Machine Learning. McGraw Hill, 1997.
- MANNING, Christopher D.; SCHUTZE, Hinrich. Foundations of statistical natural language processing. Cambridge, Massachusetts: The MIT Press, 1999. 680 p. ISBN 9780262133609.
- Newman, Mark. Networks: an introduction. OUP Oxford, 2010. 720p. ISBN 0199206651.
- BLUM, A.; HOPCROFT, J.; KANNAN, R. Foundations of Data Science. Cambridge University Press, 2020.
- GOLDBERG, Y. Neural Network Methods for Natural Language Processing. Springer International Publishing, 2017.
- GOODFELLOW, I.; BENGIO, Y.; COURVILLE, A.. Deep Learning. MIT Press, 2016.
- TUNSTALL, L.; WERRA, L. von; WOLF, T. Natural Language Processing with Transformers. 2022 O'Reilly Media, Inc.