Skip to content

Commit

Permalink
Merge pull request #2 from philsf-biostat/1-sap
Browse files Browse the repository at this point in the history
1 sap
  • Loading branch information
philsf committed Jan 7, 2021
2 parents f5e7bbb + 65d262a commit 6e753b0
Show file tree
Hide file tree
Showing 4 changed files with 365 additions and 5 deletions.
153 changes: 148 additions & 5 deletions report/SAP_DM_2020-v01.Rmd
Original file line number Diff line number Diff line change
@@ -1,7 +1,7 @@
---
title: "Plano de Análise Estatística de ..."
author: '**De:** Felipe Figueiredo **Para:** ___'
date: '**Data: ** dd/mm/aaaa'
author: '**De:** Felipe Figueiredo **Para:** Diego Rezende Martins'
date: '**Data: ** 07/01/2021'
output:
html_document:
fig_caption: yes
Expand Down Expand Up @@ -72,6 +72,12 @@ colnames(sigs) <- c("Papel", "Nome", "Função", "Assinatura", "Data")

# Lista de abreviaturas

- DM: Diabetes mellitus
- EVD:
- HAS: Hipertensão arterial sistêmica
- HT: Hipotireoidismo
- IVC:

# Introdução

## Contexto
Expand All @@ -82,37 +88,174 @@ colnames(sigs) <- c("Papel", "Nome", "Função", "Assinatura", "Data")

# Limpeza dos dados

Os dados recebidos serão reorganizados em uma tabela retangular, agrupando todos os casos em linhas com uma coluna por variável.
A coluna ID será redefinida de modo que haja um ID único para cada participante incluído no estudo, independente do grupo.
Com isso, a tabela de dados analíticos apresentará uma linha para cada observação das variáveis, i.e., cada um dos vinte participantes incluídos no estudo.

As seguintes novas variáveis serão criadas a partir para a análise:

- **EVD dif:** diferença entre EVD pré e pós (numérica)
- **Dominante:** se o lado acometido era o lado dominante do participante (dicotômica)

As seguintes variáveis serão limpas para adequação nas análises:

- **Tempo artrose:** convertida em valores numéricos
- valores possíveis: número (anos) ou célula vazia
- **Comorbidades:** redefinidas como variáveis dicotômicas
- reorganizadas em colunas independentes
- valores possíveis: nome da comorbidade ou célula vazia
- **Retorno:** Esta coluna é repetida em todas as quatro planilhas
- serão utilizados as duas primeiras ocorrências deste dado:
- Folha 1 - Tabela 1 - Volar
- Folha 1 - Tabela 2 - Dorsal

A tabela de dados analíticos será criada de acordo com a seguinte estrutura da Tabela 1.

```{r tab.dados}
tab.dados <- tibble::tibble(
ID = c(1:3, "...", 20),
Idade = "",
Sexo = "",
Grupo = "",
"EVD Pré" = "",
"EVD Pós" = "",
"EVD dif" = "",
"Lado dominante" = "",
"Lado acometido" = "",
"Dominante" = "",
Artrose = "",
"Tempo artrose" = "",
"Statisfação" = "",
"Retorno" = ""
)
pander(tab.dados, split.table = Inf)
```

Table: **Tabela 1** Estrutura da nova tabela de dados analíticos

As colunas de comorbidades serão acrescentadas à tabela de dados, seguindo a estrutura apresentada na Tabela 2.

```{r tab.dados.comorb}
tab.dados.comorb <- tibble::tibble(
ID = c(1:3, "...", 20),
"(colunas tabela 1...)" = "",
HAS = "",
DM = "",
TABAGISMO = "",
HT = "",
IVC = ""
)
pander(tab.dados.comorb, split.table = Inf)
```

Table: **Tabela 2** Representação das comorbidades na tabela de dados analíticos

# Variáveis do estudo

## Desfechos primário e secundários

Serão avaliados quatro desfechos na comparação entre os dois grupos de participantes:

**desfecho primário**

- Diferença na EVD pré e pós nos dois grupos (numérica)

**desfechos secundários**

- Alteração degenerativa (artrose) (dicotômica)
- Grau de satisfação (numérico)
- Retorno à profissão (dicotômica)

## Covariáveis

- Idade (em anos)
- Sexo (feminino/masculino)
- Acometimento no lado dominante (direito/esquerdo)
- Tempo até a artrose (em anos)
- Comorbidades (dicotômicas)
- HAS
- DM
- Tabagismo
- HT
- IVC

# Métodos estatísticos

## Análises estatísticas

### Análise descritiva

As variáveis numéricas serão descritas como média e desvio padrão.
As variáveis categóricas serão descritas como frequência e proporção.
As proporções serão apresentadas como porcentagem.

A análise descritiva será dividida em duas tabelas:

- tabela das características dos participantes do estudo, apresentando as covariáveis descritas na seção 4.2
- tabela descritiva dos desfechos do estudo descritos na seção 4.1

Ambas as tabelas apresentarão os dados estratificados nos dois grupos.

```{r tab.descr}
```

### Análise inferencial

### Modelagem estatística
A comparação de variáveis numéricas entre os dois grupos será avaliada com o teste t de Student não pareado.
O p-valor do teste t de student será apresentado na tabela descritiva dos resultados

A comparação de variáveis categóricas entre os dois grupos será avaliada com o teste exato de Fisher.

```{r tab.res}
```


<!-- ### Modelagem estatística -->

## Significância e Intervalos de Confiança

Todas as análises serão feitas com nível de significância de 5%.
Todos os testes de significância e intervalos de confiança calculados serão bilaterais.

## Tamanho da amostra e Poder

```{r}
library(pwr)
n <- 10
ES.large <- pwr.t.test(n = 10, d = 0.8)
ES.study <- pwr.t.test(n = 10, power = 0.8)
# s/m/l = .2/.5/.8
```

O desfecho primário deste estudo é uma variável numérica e será analisada com o teste t de Student.
Na ausência de estimativas prévias da média e desvio padrão do desfecho primário (EVD) a análise de poder só pode ser feita usando-se o método de Cohen (Cohen, 1988) de tamanho de efeito padronizado.
Esta abordagem utiliza apenas os dados obtidos na amostra de estudo e Cohen sugere a seguinte interpretação de tamanhos de efeito padronizados:

- efeito pequeno: d = 0.2
- efeito médio: d = 0.5
- efeito grande: d = 0.8

Com `r n` participantes incluídos em cada grupo, este estudo é capaz de detectar um tamanho de efeito grande (d = 0.8) com poder de `r format.pct(ES.large$power)` e significância de 5%.
Por outro lado, se estipularmos o nível de poder tipicamente encontrado na literatura de 80%, o efeito padronizado precisa ser pelo menos `r format.float(ES.study$d)` para que este estudo possa detectá-lo com significância de 5%.

É pouco provável que esta amostra seja suficiente para detectar um efeito estatisticamente significativo entre os grupos.

## Softwares utilizados

Esta análise será realizada utilizando-se o software `R` versão `r getRversion()`.

<!-- # Resultados -->

# Exceções e Observações
<!-- # Exceções e Observações -->

<!-- # Conclusões -->

# Referências

# Apêndice
- Cohen, J. (1988). Statistical power analysis for the behavioral sciences (2nd ed.). Hillsdale,NJ: Lawrence Erlbaum.

<!-- # Apêndice -->

Binary file added report/SAP_DM_2020-v01.docx
Binary file not shown.
Loading

0 comments on commit 6e753b0

Please sign in to comment.