A Revista científica Nature lança um
artigo nesse mês acerca de um dos assuntos mais preocupantes nas últimas
décadas: o crescimento absurdo da valoração do "p-value" nas pesquisas
científicas. A distância entre a significância estatística e a
relevância clínica tem se tornado um abismo de proporções cada vez
maiores. O assunto é tão preocupante que a ASA - American Statistical
Association, em 177 anos de fundação, se posiciona pela primeira vez com
preocupação acerca de assunto estatístico. O ASA aconselha os
pesquisadores a evitar tirar conclusões científicas ou tomar decisões
com base em valores de P isoladamente. Os pesquisadores devem descrever
não apenas as análises dos dados que produziram os resultados
estatisticamente significativos, diz a sociedade, mas todos os testes
estatísticos e as escolhas feitas nos cálculos. Caso contrário, os
resultados podem parecer falsamente robustos.
Os
valores de P são comumente utilizados para testar (e descartar) uma
'hipótese nula ", que geralmente indica que não existe uma diferença
entre dois grupos, ou que não há nenhuma correlação entre um par de
características. Quanto menor o valor de P, menor a probabilidade de um
conjunto observado de valores ocorrer por acaso - assumindo que a
hipótese nula é verdadeira. Um valor P de 0,05 ou menos é geralmente
entendido no sentido de que a declaração é estatisticamente
significativa e justifica a publicação. Mas isso não é necessariamente
verdade, segundo a ASA.
Um
valor P de 0,05, não significa que existe uma possibilidade de 95% que
uma dada hipótese é correta. Em vez disso, significa que, se a hipótese
nula é verdadeira, e todas as outras suposições feitas são válidas, há
uma chance de 5% de obter um resultado pelo menos tão extremo quanto o
observado. E um valor de P não pode indicar a importância de um achado;
por exemplo, um fármaco pode ter um efeito estatisticamente
significativo nos níveis de glicose no sangue do paciente sem ter um
efeito terapêutico.
Andrew
Vickers, um bioestatístico do Memorial Sloan Kettering Cancer Center,
em Nova York, alerta: os pesquisadores devem ser instruídos a "tratar as
estatísticas como uma ciência, e não uma receita".
Portanto, muito cuidado quando considerar apenas a relevância estatística nos estudos.
http://www.nature.com/news/ statisticians-issue-warning- over-misuse-of-p-values-1. 19503
Tamanhos do efeito do treinamento de força, por exemplo:
O American Statistical Association (ASA) aconselha os pesquisadores a
evitar tirar conclusões científicas ou tomar decisões somente com base em
valores de P isoladamente, recomendando aos pesquisadores descrever não apenas
as análises dos dados que produziram os resultados estatisticamente
significativos, mas também testes estatísticos que possam dar uma melhor
compreensão dos resultados (BAKER, 2016). Em nosso estudo trabalhamos
em conjunto com os valores P e com a designação do Tamanho do Efeito (TE), utilizando
a equação proposta por RHEA, (2004) para estudos relacionados à
treinamento de força. Comparando nossos resultados com os valores propostos para
indivíduos destreinados em treinamento de força, distribuídos nas seguintes
faixas de TE: trivial <0.5; pequeno >0.5<1.20; moderado
>1.20<2.0 e grande >2.0.
Sendo imperativo que os
pesquisadores calculem e relatem alguma medida do efeito do tratamento na
pesquisa de treinamento de força. Com a escala fornecida, também é possível
determinar a magnitude relativa dos TE´s calculados em relação a outras
pesquisas de treinamento de força. O objetivo principal da pesquisa de
treinamento de força deve ser determinar a magnitude de um efeito de
tratamento, ao invés de apenas a reprodutibilidade, dos resultados de um
estudo. Com a estatística de tamanho do efeito e a escala fornecida, os
pesquisadores podem fornecer mais Informações práticas e aplicáveis ao profissional
de força e condicionamento (RHEA,
2004)
O American Statistical Association (ASA) aconselha os pesquisadores a
evitar tirar conclusões científicas ou tomar decisões somente com base em
valores de P isoladamente, recomendando aos pesquisadores descrever não apenas
as análises dos dados que produziram os resultados estatisticamente
significativos, mas também testes estatísticos que possam dar uma melhor
compreensão dos resultados (BAKER, 2016). Em nosso estudo trabalhamos
em conjunto com os valores P e com a designação do Tamanho do Efeito (TE), utilizando
a equação proposta por RHEA, (2004) para estudos relacionados à
treinamento de força. Comparando nossos resultados com os valores propostos para
indivíduos destreinados em treinamento de força, distribuídos nas seguintes
faixas de TE: trivial <0.5; pequeno >0.5<1.20; moderado
>1.20<2.0 e grande >2.0.
Sendo imperativo que os
pesquisadores calculem e relatem alguma medida do efeito do tratamento na
pesquisa de treinamento de força. Com a escala fornecida, também é possível
determinar a magnitude relativa dos TE´s calculados em relação a outras
pesquisas de treinamento de força. O objetivo principal da pesquisa de
treinamento de força deve ser determinar a magnitude de um efeito de
tratamento, ao invés de apenas a reprodutibilidade, dos resultados de um
estudo. Com a estatística de tamanho do efeito e a escala fornecida, os
pesquisadores podem fornecer mais Informações práticas e aplicáveis ao profissional
de força e condicionamento (RHEA,
2004)