epiverse-trace
diff --git a/‎clean-data.md
Lines changed: 249 additions & 288 deletions b/‎clean-data.md
Lines changed: 249 additions & 288 deletions
diff --git a/‎data/cleaned_data.csv
Lines changed: 15001 additions & 15001 deletions b/‎data/cleaned_data.csv
Lines changed: 15001 additions & 15001 deletions
diff --git a/‎describe-cases.md
Lines changed: 54 additions & 63 deletions b/‎describe-cases.md
Lines changed: 54 additions & 63 deletions
diff --git a/‎fig/describe-cases-rendered-unnamed-chunk-10-1.png
-210 Bytes b/‎fig/describe-cases-rendered-unnamed-chunk-10-1.png
-210 Bytes
diff --git a/‎fig/describe-cases-rendered-unnamed-chunk-7-1.png
-243 Bytes b/‎fig/describe-cases-rendered-unnamed-chunk-7-1.png
-243 Bytes
diff --git a/‎fig/describe-cases-rendered-unnamed-chunk-8-1.png
-75 Bytes b/‎fig/describe-cases-rendered-unnamed-chunk-8-1.png
-75 Bytes
diff --git a/‎md5sum.txt
Lines changed: 17 additions & 17 deletions b/‎md5sum.txt
Lines changed: 17 additions & 17 deletions
diff --git a/‎read-cases.md
Lines changed: 45 additions & 38 deletions b/‎read-cases.md
Lines changed: 45 additions & 38 deletions
diff --git a/‎validate.md
Lines changed: 33 additions & 33 deletions b/‎validate.md
Lines changed: 33 additions & 33 deletions
@@ -1,18 +1,18 @@
 "file" "checksum" "built" "date"
-"CODE_OF_CONDUCT.md" "549f00b0992a7743c2bc16ea6ce3db57" "site/built/CODE_OF_CONDUCT.md" "2025-06-24"
-"LICENSE.md" "14377518ee654005a18cf28549eb30e3" "site/built/LICENSE.md" "2025-06-24"
-"config.yaml" "0f7deb99a9178d8470bd18343974bd37" "site/built/config.yaml" "2025-06-24"
-"index.md" "32bc80d6f4816435cc0e01540cb2a513" "site/built/index.md" "2025-06-24"
-"links.md" "fe82d0a436c46f4b07b82684ed2cceaf" "site/built/links.md" "2025-06-24"
-"pull_request_template.md" "0dfe2865b93d6343ab4e9a05b87e8f31" "site/built/pull_request_template.md" "2025-06-24"
-"episodes/read-cases.Rmd" "0061453aa4d45736955fd38ab4e3aaeb" "site/built/read-cases.md" "2025-06-24"
-"episodes/clean-data.Rmd" "27cddec5a389a43092a67e3992a8e8ea" "site/built/clean-data.md" "2025-06-24"
-"episodes/validate.Rmd" "1b90aff68a63ccbe0a9dce0a85a92889" "site/built/validate.md" "2025-06-24"
-"episodes/describe-cases.Rmd" "a84ee88c6c11aad9b282200084803ac1" "site/built/describe-cases.md" "2025-06-24"
-"instructors/instructor-notes.md" "ca3834a1b0f9e70c4702aa7a367a6bb5" "site/built/instructor-notes.md" "2025-06-24"
-"learners/epikinetics-descriptive.md" "50400941620956b3366fd99d51ed465b" "site/built/epikinetics-descriptive.md" "2025-06-24"
-"learners/epikinetics-statistics.md" "26868caf5a6b4a948ecb8f95c40694ab" "site/built/epikinetics-statistics.md" "2025-06-24"
-"learners/reference.md" "f081702f1c557d1ce455b7d38306737b" "site/built/reference.md" "2025-06-24"
-"learners/setup.md" "a390ed34056a3dbc9795c41ee47fd78d" "site/built/setup.md" "2025-06-24"
-"profiles/learner-profiles.md" "31b503c4b5bd1f0960ada730eca4a25e" "site/built/learner-profiles.md" "2025-06-24"
-"renv/profiles/lesson-requirements/renv.lock" "ea1fb09b89c108da8fa7de3c5e0ac8dc" "site/built/renv.lock" "2025-06-24"
+"CODE_OF_CONDUCT.md" "549f00b0992a7743c2bc16ea6ce3db57" "site/built/CODE_OF_CONDUCT.md" "2025-06-26"
+"LICENSE.md" "14377518ee654005a18cf28549eb30e3" "site/built/LICENSE.md" "2025-06-26"
+"config.yaml" "0f7deb99a9178d8470bd18343974bd37" "site/built/config.yaml" "2025-06-26"
+"index.md" "32bc80d6f4816435cc0e01540cb2a513" "site/built/index.md" "2025-06-26"
+"links.md" "fe82d0a436c46f4b07b82684ed2cceaf" "site/built/links.md" "2025-06-26"
+"pull_request_template.md" "0dfe2865b93d6343ab4e9a05b87e8f31" "site/built/pull_request_template.md" "2025-06-26"
+"episodes/read-cases.Rmd" "d7b3fde00a9c27f4556e86fd1d64c009" "site/built/read-cases.md" "2025-06-26"
+"episodes/clean-data.Rmd" "0e43d44e527eaaf6699e5c20e309dcf2" "site/built/clean-data.md" "2025-06-26"
+"episodes/validate.Rmd" "b0161edb5e0316ef803dd880931d1f12" "site/built/validate.md" "2025-06-26"
+"episodes/describe-cases.Rmd" "5e0f72993f1fe818b7388c548f7b01e8" "site/built/describe-cases.md" "2025-06-26"
+"instructors/instructor-notes.md" "ca3834a1b0f9e70c4702aa7a367a6bb5" "site/built/instructor-notes.md" "2025-06-26"
+"learners/epikinetics-descriptive.md" "50400941620956b3366fd99d51ed465b" "site/built/epikinetics-descriptive.md" "2025-06-26"
+"learners/epikinetics-statistics.md" "26868caf5a6b4a948ecb8f95c40694ab" "site/built/epikinetics-statistics.md" "2025-06-26"
+"learners/reference.md" "f081702f1c557d1ce455b7d38306737b" "site/built/reference.md" "2025-06-26"
+"learners/setup.md" "a390ed34056a3dbc9795c41ee47fd78d" "site/built/setup.md" "2025-06-26"
+"profiles/learner-profiles.md" "31b503c4b5bd1f0960ada730eca4a25e" "site/built/learner-profiles.md" "2025-06-26"
+"renv/profiles/lesson-requirements/renv.lock" "424c3e8ad31974da7435ae5c1dfe909b" "site/built/renv.lock" "2025-06-26"
@@ -31,11 +31,11 @@ This episode requires you to:
 In outbreak analysis, once you have completed the initial steps of reading and cleaning the case data,
 it's essential to establish an additional foundation layer to ensure the integrity and reliability of subsequent
 analyses. Otherwise you might find that your analysis suddenly stops working when specific variables appear or disappear, or their underlying data types (like `<date>` or `<chr>`) change. Specifically, this additional layer involves: 1) verifying the presence and correct data type of certain columns within
-your dataset, a process commonly referred to as "tagging"; 2) implementing measures to 
-check that these tagged columns are not inadvertently deleted during further data processing steps, known as "validation".
+your dataset, a process commonly referred to as **tagging**; 2) implementing measures to 
+check that these tagged columns are not inadvertently deleted during further data processing steps, known as **validation**.
 
 
-This episode focuses tagging and validate outbreak data using the [linelist](https://epiverse-trace.github.io/linelist/)
+This episode focuses on tagging and validate outbreak data using the [linelist](https://epiverse-trace.github.io/linelist/)
  package. Let's start by loading the package `{rio}` to read data and the package `{linelist}` 
 to create a linelist object. We'll use the pipe `%>%` to connect some of their functions, including others from 
 the package `{dplyr}`, so let's also call to the tidyverse package:
@@ -79,19 +79,19 @@ cleaned_data <- rio::import(
 
 
 ``` output
-# A tibble: 15,000 × 10
-      v1 case_id   age gender status    date_onset date_sample row_id
-   <int>   <int> <dbl> <chr>  <chr>     <IDate>    <IDate>      <int>
- 1     1   14905    90 male   confirmed 2015-03-15 2015-06-04       1
- 2     2   13043    25 female <NA>      2013-09-11 2014-03-01       2
- 3     3   14364    54 female <NA>      2014-09-02 2015-03-03       3
- 4     4   14675    90 <NA>   <NA>      2014-10-19 2031-12-14       4
- 5     5   12648    74 female <NA>      2014-08-06 2016-10-10       5
- 6     6   14274    76 female <NA>      2015-04-05 2016-01-23       7
- 7     7   14132    16 male   confirmed NA         2015-05-10       8
- 8     8   14715    44 female confirmed NA         2016-04-24       9
- 9     9   13435    26 male   <NA>      2014-09-07 2020-09-14      10
-10    10   14816    30 female <NA>      2015-06-29 2015-06-02      11
+# A tibble: 15,000 × 9
+      v1 case_id   age gender status    date_onset date_sample
+   <int>   <int> <dbl> <chr>  <chr>     <IDate>    <IDate>    
+ 1     1   14905    90 male   confirmed 2015-03-15 2015-04-06 
+ 2     2   13043    25 female <NA>      2013-09-11 2014-01-03 
+ 3     3   14364    54 female <NA>      2014-02-09 2015-03-03 
+ 4     4   14675    90 <NA>   <NA>      2014-10-19 2014-12-31 
+ 5     5   12648    74 female <NA>      2014-06-08 2016-10-10 
+ 6     6   14274    76 female <NA>      2015-04-05 2016-01-23 
+ 7     7   14132    16 male   confirmed NA         2015-10-05 
+ 8     8   14715    44 female confirmed NA         2016-04-24 
+ 9     9   13435    26 male   <NA>      2014-07-09 2014-09-20 
+10    10   14816    30 female <NA>      2015-06-29 2015-02-06 
 # ℹ 14,990 more rows
 # ℹ 2 more variables: years_since_collection <int>, remainder_months <int>
 ```
@@ -138,19 +138,19 @@ linelist_data
 ``` output
 
 // linelist object
-# A tibble: 15,000 × 10
-      v1 case_id   age gender status    date_onset date_sample row_id
-   <int>   <int> <dbl> <chr>  <chr>     <IDate>    <IDate>      <int>
- 1     1   14905    90 male   confirmed 2015-03-15 2015-06-04       1
- 2     2   13043    25 female <NA>      2013-09-11 2014-03-01       2
- 3     3   14364    54 female <NA>      2014-09-02 2015-03-03       3
- 4     4   14675    90 <NA>   <NA>      2014-10-19 2031-12-14       4
- 5     5   12648    74 female <NA>      2014-08-06 2016-10-10       5
- 6     6   14274    76 female <NA>      2015-04-05 2016-01-23       7
- 7     7   14132    16 male   confirmed NA         2015-05-10       8
- 8     8   14715    44 female confirmed NA         2016-04-24       9
- 9     9   13435    26 male   <NA>      2014-09-07 2020-09-14      10
-10    10   14816    30 female <NA>      2015-06-29 2015-06-02      11
+# A tibble: 15,000 × 9
+      v1 case_id   age gender status    date_onset date_sample
+   <int>   <int> <dbl> <chr>  <chr>     <IDate>    <IDate>    
+ 1     1   14905    90 male   confirmed 2015-03-15 2015-04-06 
+ 2     2   13043    25 female <NA>      2013-09-11 2014-01-03 
+ 3     3   14364    54 female <NA>      2014-02-09 2015-03-03 
+ 4     4   14675    90 <NA>   <NA>      2014-10-19 2014-12-31 
+ 5     5   12648    74 female <NA>      2014-06-08 2016-10-10 
+ 6     6   14274    76 female <NA>      2015-04-05 2016-01-23 
+ 7     7   14132    16 male   confirmed NA         2015-10-05 
+ 8     8   14715    44 female confirmed NA         2016-04-24 
+ 9     9   13435    26 male   <NA>      2014-07-09 2014-09-20 
+10    10   14816    30 female <NA>      2015-06-29 2015-02-06 
 # ℹ 14,990 more rows
 # ℹ 2 more variables: years_since_collection <int>, remainder_months <int>
 
@@ -357,7 +357,7 @@ cleaned_data %>%
 ``` error
 Error in base::tryCatch(base::withCallingHandlers({: 1 assertions failed:
  * Variable 'tag': Must be element of set
- * {'v1','case_id','gender','status','date_onset','date_sample','row_id','years_since_collection','remainder_months'},
+ * {'v1','case_id','gender','status','date_onset','date_sample','years_since_collection','remainder_months'},
  * but is 'age'.
 ```
 
@@ -449,13 +449,13 @@ linelist::tags_df(linelist_data)
    <int> <IDate>    <chr> 
  1 14905 2015-03-15 male  
  2 13043 2013-09-11 female
- 3 14364 2014-09-02 female
+ 3 14364 2014-02-09 female
  4 14675 2014-10-19 <NA>  
- 5 12648 2014-08-06 female
+ 5 12648 2014-06-08 female
  6 14274 2015-04-05 female
  7 14132 NA         male  
  8 14715 NA         female
- 9 13435 2014-09-07 male  
+ 9 13435 2014-07-09 male  
 10 14816 2015-06-29 female
 # ℹ 14,990 more rows
 ```