SwissIsoform

SwissIsoform is a Python package for analyzing and visualizing alternative protein isoforms discovered through ribosome profiling data. It provides tools for integrating genomic, mutation, and isoform data to generate comprehensive visualizations of protein variants.

Features

Genome sequence and annotation handling
Alternative isoform visualization
Integration of mutation data from multiple sources:
- gnomAD
- ClinVar
- Custom aggregator files
Configurable visualization options for different feature types
Support for zoomed visualization of specific regions

Installation

Clone the repository:

git clone https://github.com/cheeseman-lab/swissisoform.git
cd swissisoform

Create and activate the conda environment:

conda env create --file=environment.yml
conda activate swissisoform

Data Requirements

The package requires several data files to function:

1. Reference Genome and Annotations

Download the required genome files:

cd data/genome_data
bash download_genome.sh

This will download:

Human reference genome (hg38.fa)
NCBI RefSeq annotations (hg38.ncbiRefSeq.gtf)

2. Alternative Start Sites

Required format: BED file
Expected fields: chromosome, start, end, name (format: ENSGXXXXX_GENE_STARTCODON_TYPE)

3. Mutation Data (Optional)

The package can integrate mutation data from:

gnomAD (accessed via API)
ClinVar (accessed via API)
Custom aggregator files (CSV format)

Usage

Basic Example

Here's a comprehensive example demonstrating the new approach to analyzing and visualizing isoforms with mutation data:

from swissisoform.genome import GenomeHandler
from swissisoform.visualize import GenomeVisualizer
from swissisoform.isoform import AlternativeIsoform
from swissisoform.mutations import MutationHandler
from swissisoform.utils import analyze_mutations
import os

# Initialize handlers
genome = GenomeHandler(
    'data/genome_data/hg38.fa',
    'data/genome_data/hg38.ncbiRefSeq.gtf'
)

# Load alternative isoform data
alt_isoforms = AlternativeIsoform()
alt_isoforms.load_bed('path/to/isoforms.bed')

# Initialize mutation handler
mutation_handler = MutationHandler()

# Process a specific gene
gene_name = "NAXE"
output_dir = f"./{gene_name}/"
os.makedirs(output_dir, exist_ok=True)

# Get alternative isoform features
alt_features = alt_isoforms.get_visualization_features(gene_name)

# Get transcript information
transcript_info = genome.get_transcript_ids(gene_name)

# Analyze mutations with different filtering options
mutations_unfiltered = await analyze_mutations(
    gene_name=gene_name, 
    mutation_handler=mutation_handler,
    alt_features=alt_features, 
    sources=["clinvar"],
)

# Filter mutations by impact type
impact_types = {
    "clinvar": ["missense variant", "nonsense variant", "frameshift variant"],
}
mutations_filtered = await analyze_mutations(
    gene_name=gene_name, 
    mutation_handler=mutation_handler,
    alt_features=alt_features, 
    sources=["clinvar"], 
    impact_types=impact_types,
)

# Create visualizations
visualizer = GenomeVisualizer(genome)

# Generate visualizations for each transcript
for _, transcript in transcript_info.iterrows():
    transcript_id = transcript['transcript_id']
    
    # Standard view with unfiltered mutations
    visualizer.visualize_transcript(
        gene_name=gene_name,
        transcript_id=transcript_id,
        alt_features=alt_features,
        mutations_df=mutations_unfiltered,
        output_file=f'{output_dir}{transcript_id}_unfiltered.png'
    )
    
    # Standard view with filtered mutations
    visualizer.visualize_transcript(
        gene_name=gene_name,
        transcript_id=transcript_id,
        alt_features=alt_features,
        mutations_df=mutations_filtered,
        output_file=f'{output_dir}{transcript_id}_filtered.png'
    )
    
    # Zoomed view for detailed analysis
    visualizer.visualize_transcript_zoomed(
        gene_name=gene_name,
        transcript_id=transcript_id,
        alt_features=alt_features,
        mutations_df=mutations_filtered,
        output_file=f'{output_dir}{transcript_id}_filtered_zoom.png',
        padding=100
    )

For more detailed examples and use cases, see the Jupyter notebooks in notebooks/.

License

MIT License - see LICENSE file for details.

Name	Name	Last commit message	Last commit date
Latest commit mdiberna cleaned up mutation colors and plotting Mar 5, 2025 8904af0 · Mar 5, 2025 History 22 Commits
data/genome_data	data/genome_data	general cleanup with new bed file	Mar 4, 2025
scripts	scripts	cleaned up mutation colors and plotting	Mar 5, 2025
src/swissisoform	src/swissisoform	cleaned up mutation colors and plotting	Mar 5, 2025
.gitignore	.gitignore	cleaned up mutation colors and plotting	Mar 5, 2025
LICENSE	LICENSE	initial commit	Jan 28, 2025
README.md	README.md	cleanup of mutation data, close to finalization	Feb 24, 2025
environment.yml	environment.yml	cleanup of mutation data, close to finalization	Feb 24, 2025
pyproject.toml	pyproject.toml	initial commit	Jan 28, 2025

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

SwissIsoform

Features

Installation

Data Requirements

1. Reference Genome and Annotations

2. Alternative Start Sites

3. Mutation Data (Optional)

Usage

Basic Example

License

About

Releases

Packages

Languages

License

cheeseman-lab/swissisoform

Folders and files

Latest commit

History

Repository files navigation

SwissIsoform

Features

Installation

Data Requirements

1. Reference Genome and Annotations

2. Alternative Start Sites

3. Mutation Data (Optional)

Usage

Basic Example

License

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages