






Estude fácil! Tem muito documento disponível na Docsity
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Prepare-se para as provas
Estude fácil! Tem muito documento disponível na Docsity
Prepare-se para as provas com trabalhos de outros alunos como você, aqui na Docsity
Encontra documentos específicos para os exames da tua universidade
Prepare-se com as videoaulas e exercícios resolvidos criados a partir da grade da sua Universidade
Responda perguntas de provas passadas e avalie sua preparação.
Ganhe pontos para baixar
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Os resultados de um questionário realizado em um colóquio da puc-sp sobre a implicação estatística em análise de dados multidimensionais. O artigo discute a importância e a relevância dessa análise em pesquisas de educação matemática e outras áreas. O texto aborda as fases fundamentais de uma análise de dados multidimensionais, oferece estudos teóricos e oficinas sobre diferentes métodos, e apresenta exemplos de dados encontrados em pesquisas da puc-sp.
Tipologia: Manuais, Projetos, Pesquisas
1 / 12
Esta página não é visível na pré-visualização
Não perca as partes importantes!







A implicação estatística usada como ferramenta em um exemplo de análise de dados multidimensionais Régis Gras 1 Saddo Ag Almouloud 2
Resumo O artigo apresenta os resultados de um questionário cujo objetivo é analisar as opiniões dos participantes de um colóquio organizado pela PUC/SP sobre a implicação estatística de análise de dados multidimensionais. O colóquio foi realizado no intuito de estudar as potencialidades, a pertinência e a importância da realização de uma análise implicativa nas investigações das Ciências da Educação. A implicação estatística foi a principal ferramenta para analisar as informações envolvidas neste questionário.
Palavras-chave: implicação estatística, metodologia de análise de dados, hierarquia de similaridade, hierarquia implicativa, avaliação.
Resumé: L´article présente les résultats d´un questionnaire dont l´objectif est l´étude des opinions des participants d´un colloque organisé à la Pontifícia Universidade Católica de São Paulo, sur l´analyse implicative de données statistiques multidimensionnelles. Le colloque a pour objectif d´étudier les potentialités, la pertinence et l´importance de l´analyse implicative pour les recherches en sciences de l´éducation. L´implication statistique a été l´outil principal de traitement et d´analyse des données issues de ce questionnaire.
Mots – Clés: implication statistique, méthodologie d´analyse de données, hiérarchie de similarité, hiérarchie implicative, évaliation.
I- Introdução
Este artigo discute os resultados de um questionário cujo objetivo é avaliar o colóquio intitulado “O método estatístico implicativo utilizado em estudos qualitativos de regras de associação: contribuição à pesquisa em educação”, realizado em julho de 2003 no Programa de Estudos pós-graduados em Educação Matemática da PUC/SP.. O colóquio tem por objetivo principal realizar um estudo de refinamento sobre as pontecialidades, a pertinência bem como a importância da realização de análises estatísticas
(^1) Professeur Emérite à l’Ecole Polytechnique de l'Université de Nantes, La Chantrerie, BP 50609 44306 Nantes cedex 03, e-mail : [email protected] (^2) Professor do Programa de Estudos Pós-Graduados em Educação Matematica – PUC/SP e-mail : [email protected].
de dados multidimensionais (análise hierárquica de similaridade, análise implicativa) nas investigações da Educação Matemática e em investigações em Educação de um modo mais abrangente. Foram previstas para o desenvolvimento do trabalho três momentos:
II- Estrutura do questionário
Para a constituição do corpo de informações a ser analisado, foi aplicado um questionário- avaliação aos participantes do colóquio. O questionário(cf. anexo 1), além de informações pessoais, solicitava que os participantes respondessem a quatro questões subjetivas, que objetivavam fornecer uma visão de como eles vivenciaram a programação e os conteúdos trabalhados no evento. As questões subjetivas foram as seguintes: 1) Suas expectativas foram satisfeitas: ( ) Sim ( ) Parcialmente ( ) Não
semelhança (e não semelhança) decrescente, classes de variáveis, constituídas significativamente a certos níveis da árvore e se opondo a outras nestes mesmos níveis. O critério de similaridade se exprime da maneira seguinte nos casos das variáveis binárias (presença – ausência, verdadeiro – falsa, sim – não, etc...): 2 variáveis a e b, satisfeitas respectivamente por dois sub-conjuntos A e B de E, são muito semelhantes quando o número k dos sujeitos de A ∧ B é importante de um lado, pelo que teria sido no caso da ausência de ligação entre a e b, e por outro lado, com relação aos cardinais de E, A e B. Medimos esta semelhança pela probabilidade de que k seja superior ao número aleatório esperado nesta situação. A modelagem probabilista da variável aleatória, cujo k é a realização, pode ser uma distribuição binomial ou de Poisson à escolha do usuário. A segunda distribuição supõe que E seja uma amostra de uma população grande, o que a primeira não supõe. Se E não tem nenhuma razão estatística a priori de ser representativo, é preferível usar o modelo binomial que analisa a estrutura de E enquanto tal. Quando os parâmetros o permitem, uma aproximação gaussiana destas duas leis é efetuada. O índice de similaridade entre variáveis é usado para definir um índice de similaridade entre duas classes de variáveis segundo o princípio de comparação entre a observação e o que seria dado pelo acaso. Um índice, dito de coesão, permite reagrupar as classes de variáveis.
XSSMBOINFCANCURAMAESTXSPDIFICTIFDACTABEIMAAEXPIEXPMCUITPATPGFM
Arbre des similarités : C:\chcicsp\CHIC 3.1Sao Paulo\AVALIA2.csv
Subclasse A1Subclasse A2 Subclasse B1 Subclasse B2Classe C
Assim, para construir uma árvore de similaridade(cf. árvore acima), reunimos em uma classe de primeiro nível, primeiramente, as 2 variáveis que são mais similares no sentido do índice de similaridade, depois 2 outras variáveis ou uma variável e a classe já formada no sentido do índice da classe, e depois outras variáveis ou classes de variáveis.
Interpretação sucinta No primeiro nível, aparece uma relação de similaridade entre as únicas duas variáveis mais ou menos restritivas: “expectativas parcialmente satisfeitas” e “difícil”. O ritmo do colóquio pode explicar o cansaço, tanto mais que a carga teórica era muito importante. Identificamos aqui, talvez, o desequilibro entre aportes teóricos e ilustrações. Mas a representação deste fenômeno é muito minoritária. Sublinhamos, por outro lado e a contrário, que a relação entre satisfação (84¨%) e o fato de reconhecer que o colóquio foi satisfatório de modo geral aparece em um outro nível. É este caráter (MBO) que consideramos como indício de satisfação. A variável EF é a mais típica desta relação. Globalmente, distinguimos na hierarquia, da esquerda para direita, três grandes classes de variáveis: classe A subdividida em A1 e A2, a classe B, subdividida em B1 e B2 e enfim C. A classe A corresponde a um conjunto de participantes que estão muito satisfeitos por que se investiram muito durante as jornadas, apesar da extensão e da variedade da programação do colóquio Se alguns participantes se dizem cansados, isto parece estar no próprio e total engajamento do sujeito nas atividades. Cansados, certo, mas apreenderam muito e a curiosidade deles foi plenamente satisfeita. A variável suplementar G é típica de A. A1 é a subclasse precedentemente analisada (XSS e MBO) A subclasse A2 evoca um cansaço (CAN) relacionado com novas aprendizagens e, então a uma curiosidade plenamente preenchida (tipicalidade G). A classe B contém as nuanças explicando a percepção da dificuldade e, então da satisfação parcial:
Notamos portanto que é a variável AMA que articula os dois caminhos. Pode-se interpretá-la de modo contraposto assim: “se não estivesse satisfeito pelas manipulações, então não desejaria ter outras na ocasião de um próximo colóquio”. O segundo mostra que a satisfação total (MBO) está muito ligada ao caráter estimulante das atividades (EST). Observamos que são as variáveis suplementares EF (Ensino Fundamental) e G que parecem ser mais responsáveis desta estrutura S1.
A subclasse S 2 é constituída de três implicações simples:
2º Hierarquia coesitiva observada
Observa-se que poucas grandes classes se formaram. Todas as classes, exceto uma, são constituídas de dois elementos. Este fato é devido muito ao número relativamente importante de variáveis em relação ao número de sujeitos. Analisaremos, então, brevemente cada uma dessas classes respeitando a sua ordem de qualidade de coesão decrescente.
ITPGFMIEXPIMAIFDICTACTABEAMAESTMCUCANINFCURAEXPATPMBOXSSDIFXSP
Arbre cohésitif : C:\chcicsp\CHIC 3.1Sao Paulo\AVALIA2.csv
Apprentissage (ECA) , vol. 1, n° 1-2, 69-80. Hermès Science Publication, 2001 GRAS R., KUNTZ P. et BRIAND H.: Les fondements de l'analyse statistique implicative et quelques prolongements pour la fouille de données, Mathématiques et Sciences Humaines , n° 154-155, p 9-29, ISSN 0987 6936, 2001 GRAS R., DIDAY E., KUNTZ P., COUTURIER R.: Variables sur intervalles et variables- intervalles en analyse statistique implicative, Actes du 8ème^ Congrès de la Société Francophone de Classification, Université des Antilles-Guyane, Pointe-à-Pitre, 17- décembre 2001, pp 166- GRAS Régis., GUILLET Fabrice, GRAS Robin et PHILIPPE Jacques Réduction des colonnes d’un tableau de données par quasi-équivalence entre variables , Extraction des connaissances et apprentissage, Hermès, Volume 1, n°4/2001, p 197-202, ISBN 2- 7462-0406-1, 2002 GRAS R., KUNTZ P., BRIAND H.: Hiérarchie orientée de règles généralisées en analyse implicative, Extraction des Connaissances et apprentissage, Hermès, p 145-157, ISSN 0992-499X, ISBN 2-7462-0631-5, 2003. LERMAN I.C., GRAS R. et ROSTAM H., (1981) : Elaboration et évaluation d'un indice d'implication pour des données binaires, I et II, Mathématiques et sciences Humaines, n°75, Paris.
1 a^ Parte: Identificação(variáveis suplementares) Data: ________________
Sexo: ( ) Masculino M s ( ) Feminino F s
Em que grau(s) de ensino leciona neste ano?
( ) Ensino Fundamental EF s ( ) Ensino Médio EM s ( ) Ensino Superior ES s
( ) Pós-Graduação PG s
2 a^ Parte: Opinião (varáveis principais)
( ) Sim XSS ( ) Parcialmente XSP ( ) Não XSN
Quais os pontos da programação despertaram mais seu interesse? ICT (teoria, conceitual), INF (novas funcionalidades de CHIC), IMA (manipulação de CHIC), ITP (relação teoria-prática), IEXP (aplicações, experiências), IFD (forma dinâmica eficaz)
Quais aspectos você desejaria aprofundar mais? ACT (teoria, conceitual), AMA (manipulação de CHIC), ATP (relação teoria-prática), AEXP (aplicações, experiências)
Na lista abaixo, escolhe a(s) expressão(ões) que melhor expressa(m) seus sentimentos a propósito do colóquio. ( ) muito longo MLO ( ) muito curto MCU ( ) Cansativo CAN ( ) Estimulante EST ( ) Curiosidade CUR ( ) muito bom MBO ( ) Inútil INU ( ) Abertura ABE ( ) difícil DIF ( ) gostaria fazer mais GFM
Ocorrência Média Desvio padrão XSS : 21.00 0.84 0.