Identificação de deficiências em textos educacionais com a aplicação de processamento de linguagem natural e aprendizado de máquina

Autores

DOI:

https://doi.org/10.20396/etd.v24i2.8660061

Palavras-chave:

Desenvolvimento educacional, Redação, Inteligência artificial, Tecnologia, Gestão do conhecimento

Resumo

A correção de textos educacionais como redações e questões discursivas é uma tarefa importante, além disso, diversas escolas têm exigido a intensificação da atividade da escrita para a evolução do discente. Entretanto, o esforço despendido para a correção pode aumentar a carga de trabalho do professor ou até mesmo gerar custos adicionais, bem como um longo tempo de correção para instituições como o MEC (Ministério da Educação), que é responsável pela aplicação do ENEM (Exame Nacional do Ensino Médio). Em 2019 foi anunciado pelo MEC a tendência do ENEM se tornar digital, trazendo novas possibilidades para a análise e avaliação das redações elaboradas pelos estudantes. Neste contexto, algumas técnicas de inteligência artificial para análise de textos educacionais tem se revelado úteis no processo de avaliação automática da linguagem escrita. Assim, o objetivo desta pesquisa é analisar textos empregando para tanto as técnicas de Processamento de Linguagem Natural e Aprendizado de Máquina para identificar deficiências em textos educacionais. Esta pesquisa experimental consistiu na classificação de 695 redações elaboradas em língua portuguesa em 20 temas. Os resultados demonstraram que as técnicas empregadas possibilitaram a identificação de redações cujo conteúdo foge à temática proposta na prova, dentre outras informações importantes para que o docente possa identificar falhas na escrita da redação, tais como a coesão textual ou texto insuficiente. Os resultados esperados com a aplicação da solução desenvolvida neste experimento buscam otimizar o trabalho do professor, bem como reduzir o tempo e o custo do processo de avaliação de textos educativos.

Downloads

Não há dados estatísticos.

Biografia do Autor

Cíntia Maria de Araújo Pinho, Universidade Nove de Julho

Mestranda do Programa de Pós-graduação em Informática e Gestão do Conhecimento pela Universidade Nove de Julho (UNINOVE).  Docente na ETEC na área de Gestão e Informática do Centro Estadual de Educação Tecnológica Paula Souza, ETEC Prof. Maria Cristina Medeiros. Ribeirão Pires, SP - Brasil.

Amanda Ferreira de Moura, Universidade Nove de Julho

Mestranda do Programa de Pós-graduação em Informática e Gestão do Conhecimento pela Universidade Nove de Julho (UNINOVE). São Paulo, SP - Brasil.

Marcos Antonio Gaspar, Universidade Nove de Julho

Doutor em Administração pela Universidade de São Paulo (USP). São Paulo, SP - Brasil. Docente permanente e pesquisador no Programa de Pós-graduação em Informática e Gestão do Conhecimento da Universidade Nove de Julho (UNINOVE). São Paulo, SP - Brasil.

Domingos Márcio Rodrigues Napolitano, Universidade Nove de Julho

Doutor em Informática e Gestão do Conhecimento pela Universidade Nove de Julho (UNINOVE). São Paulo, SP - Brasil. Docente permanente e pesquisador do Programa de Pós-graduação em Informática e Gestão do Conhecimento da Universidade Nove de Julho (UNINOVE). São Paulo, SP - Brasil.

Referências

ARAÚJO, U. A quarta revolução educacional: a mudança de tempos, espaços e relações na escola a partir do uso de tecnologias e da inclusão social. ETD - Educação Temática Digital, v. 12, n. esp., p. 31-48, 2011. DOI: https://doi.org/10.20396/etd.v12i0.1202

BAZELATO, B. S.; AMORIM, E. C. F. A bayesian classifier to automatic correction of portuguese essays. In: CONGRESSO INTERNACIONAL DE INFORMÁTICA EDUCATIVA (TISE), 18., 2013. Anais... Porto Alegre: CCC, 2013, p. 1-13.

BHOJARAJU, G. Knowledge management: why do we need it for corporates. Malaysian Journal of Library & Information Science, p. 1-14, 2019.

BRACHMAN, R. J. Mining business databases. Communications of the ACM, p. 42, nov. 1996. DOI: https://doi.org/10.1145/240455.240468

BRANDON, R. Document clustering with Python - Top 100 films of all time. 2014. Disponível em: http://brandonrose.org/clustering . Acesso em: 03 maio 2021

BRASIL - Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira (Inep). A redação no Enem 2019: cartilha do participante. Brasília: INEP, 2019.

BREWER, P. D.; BREWER, K. L. Knowledge management, human resource management, and higher education: a theoretical model. Journal of Education for Business, v. 85, n. 6, p. 330-335, 2010. DOI: https://doi.org/10.1080/08832321003604938

CÂNDIDO, T.; WEBBER, C. Avaliação da coesão textual: desafios para automatizar a correção de redações. RENOTE, v. 16, n. 1, p. 103-112, 2018. DOI: https://doi.org/10.22456/1679-1916.86013

SOUZA, C. Mineração de dados educacionais para avaliar os fatores que influenciam no desempenho de candidatos do ENEM. Trabalho de Conclusão de Curso (Análise e Desenvolvimento de Sistemas) - Universidade Federal Fluminense. Rio de Janeiro: UFF, 2019.

EPSTEIN, D.; REATEGUI, E. B. Uso de mineração de textos no apoio à compreensão textual. RENOTE, v. 13, n. 1, p. 1-10, 2015. DOI: https://doi.org/10.22456/1679-1916.57647

FÁVERO, L. P.; BELFIORE, P.; SILVA, F. L.; CHAN, B. L. Análise de dados: modelagem multivariada para tomada de decisões. Rio de Janeiro: Elsevier-Campos, 2009.

FAYYAD, U.; PIATETSKY-SHAPIRO, G.; SMYTH, P.; UTHURUSAMY, R. Advances in knowledge discovery & data mining. Menlo Park: American Association for Artificial Intelligence, 1995.

FERNANDEZ, P. J.; MARQUES, P. C. F. Data science, marketing & business. São Paulo: Insper, 2019.

GASPAR, M. A.; SANTOS, S. A.; DONAIRE, D.; KUNIYOSHI, M. S.; MAGALHÃES, F. L. F. de. Gestão do conhecimento em empresas atuantes na indústria de software no Brasil: um estudo das práticas e ferramentas utilizadas. Informação & Sociedade: Estudos, v.26, n.1, p. 151-166, jan./abr. 2016.

GUNJAL, B. Knowledge management: why do we need it for corporates. Malaysian Journal of Library & Information Science, p. 1-14, Apr 2019. DOI: https://doi.org/10.31229/osf.io/fy984

HAIR JUNIOR, J. F.; BLACK, W. C.; BABIN, B. J.; ANDERSON, R. E.; TATHAM, R. L. Análise multivariada de dados. 6.ed. Porto Alegre, Bookman, 2009.

HONDA, H. Introdução básica à clusterização. Brasília: UNB, 2017.

LLOYD, S. P. Least squares quantization in PCM. IEEE Trans. Inf. Theory, v. 28, p. 129-136, 1982. DOI: https://doi.org/10.1109/TIT.1982.1056489

MACEDO, A. L.; BEHAR, P. A.; AZEVEDO, B. F. T. Acompanhamento da interação e produção textual coletiva por meio de mineração de textos. ETD - Educação Temática Digital, .v. 16, n. 1, p. 67-83, 2014.

MARTIN, J H.; JURAFSKY, D. Speech and language processing: an introduction to natural language processing, computational linguistics, and speech recognition. Upper Saddle River: Pearson/Prentice Hall, 2009.

MEC - Ministério da Educação. Enem terá aplicação digital em fase piloto em 2020 e deixará de ter versão em papel em 2026. Brasília: MEC, 03 jul. 2019.

MORAIS, E. A. M.; AMBRÓSIO, A. P. L. Mineração de textos. Relatório técnico. Goiânia: UFGO, 2007.

MUNGIOLI, M. C. P. Jogando com o narrador: estratégias narrativas na produção de textos em ambientes escolares informatizados. ETD - Educação Temática Digital, v. 10, n. 1, p. 24-48, 2009. DOI: https://doi.org/10.20396/etd.v10i1.1014

NEWMAN, D.; LAU, J. H.; GRIESER, K.; BALDWIN, T. Automatic evaluation of topic coherence. In: Annual Conference of the North American Chapter of the Association for Computational Linguistics, 2010. Proceedings... Association for Computational Linguistics, 2010, p. 100-108.

NOBRE, J. C. S.; PELLEGRINO, S. R. M. ANAC: um analisador automático de coesão textual em redação. In: BRAZILIAN SYMPOSIUM ON COMPUTERS IN EDUCATION - SBIE, 2010. Anais... Porto Alegre: SBC, 2010, p. 1-12.

NONAKA, I; TAKEUCHI, H. Criação de conhecimento na empresa. Rio de Janeiro: Elsevier, 1997.

PORTO FILHO, C. H. Técnicas de aprendizado não supervisionado baseadas no algoritmo da caminhada do turista. Dissertação (Mestrado em Bioengenharia) – Programa de Pós-graduação em Bioengenharia - Universidade de São Paulo. São Carlos, USP, 2017.

RÊGO, A. S. da C. Aprendizado automático de relações semânticas entre tags de folksonomias. Tese (Doutorado em Ciência da Computação) - Programa de Pós-graduação em Ciência da Computação - Universidade Federal de Campina Grande. Campina Grande, UFCG, 2016.

ROCHA, G.; MORENO, A. C. Enem 2018: número de redações nota mil volta a crescer, e cai o número de notas zero. Rio de Janeiro: Portal G1, 18 jan. 2019.

ROSSI, R. G. Classificação automática de textos por meio de aprendizado de máquina baseado em redes. 2015. Tese (Doutorado em Ciências de Computação e Matemática Computacional) - Instituto de Ciências Matemáticas e de Computação - Universidade de São Paulo. São Carlos, USP, 2015.

SALTON, G.; YANG, C. S. On the specification of term values in automatic indexing. Journal of Documentation, v. 29, n. 4, p. 351-372, 1973. DOI: https://doi.org/10.1108/eb026562

SERENKO, A.; BONTIS, N.; BOOKER, L. D.; SADEDDIN, K. W. A scientometric analysis of knowledge management and intellectual capital academic literature (1994-2008). Journal of Knowledge Management, v. 14, n. 1, p. 3-23, 2010. DOI: https://doi.org/10.1108/13673271011015534

SHERMIS, M. D.; BURSTEIN, J.; HIGGINS, D.; ZECHNER, K. Automated essay scoring: Writing assessment and instruction. International Encyclopedia of Education, v. 4, n. 1, p. 20-26, 2010. DOI: https://doi.org/10.1016/B978-0-08-044894-7.00233-5

VILLALON, J.; CALVO, R. A. Concept extraction from student essays, towards concept map mining. In: IEEE INTERNATIONAL CONFERENCE ON ADVANCED LEARNING TECHNOLOGIES, 9th , 2009. Proceedings… IEEE, jul. 2009, p. 221-225. DOI: https://doi.org/10.1109/ICALT.2009.215

Downloads

Publicado

2022-05-23

Como Citar

Pinho, C. M. de A. ., Moura, A. F. de, Gaspar, M. A., & Napolitano, D. M. R. (2022). Identificação de deficiências em textos educacionais com a aplicação de processamento de linguagem natural e aprendizado de máquina. ETD - Educação Temática Digital, 24(2), 350–372. https://doi.org/10.20396/etd.v24i2.8660061