Master Mass Cytometry Data Analysis with R: Complete Step-by-Step Guide

Mass cytometry data analysis has become essential for researchers studying complex cellular populations, yet many scientists struggle with expensive software limitations and steep learning curves. This comprehensive tutorial demonstrates how to perform professional mass cytometry data analysis using free R tools, transforming raw CyTOF data into publication-ready insights without costly software licenses.

🎯

Feeling Overwhelmed? We've Got You Covered!

Don't worry if this tutorial seems complex at first glance. Our comprehensive step-by-step video course walks you through every single installation and analysis step with clear, easy-to-follow explanations.

✅ Simple guided tutorials for complete beginners ✅ Package installation demonstrated step-by-step ✅ Real-time coding sessions you can follow along ✅ Expert explanations that make complex concepts simple

🎬 Watch Step-by-Step Video Course

🚀 Why R is Revolutionizing Mass Cytometry Data Analysis

Traditional mass cytometry data analysis relies on expensive commercial software that can cost thousands of dollars annually. FlowJo, Cytobank, and similar platforms create budget constraints for academic laboratories while limiting analytical flexibility. R-based mass cytometry data analysis offers a powerful alternative that provides:

🆓

Complete Cost Freedom

Unlike commercial cytometry software with recurring licensing fees, R provides unlimited mass cytometry data analysis capabilities at zero cost. Academic laboratories can allocate budget resources to research instead of software subscriptions.

🔬

Advanced Analytical Capabilities

R's extensive package ecosystem enables sophisticated mass cytometry data analysis approaches that surpass commercial software limitations:

Method documentation: Every analysis step recorded in executable code
Peer review compatibility: Colleagues can examine and validate analytical approaches
Publication standards: Journals increasingly require reproducible analytical methodologies
Cross-laboratory consistency: Standardized protocols that work across different research environments

🛠️ Getting Started with Mass Cytometry Data Analysis in R

Essential R Packages for Mass Cytometry Data Analysis

Before beginning mass cytometry data analysis, install these critical R packages that form the foundation of professional cytometry workflows:

# Core cytometry packages for mass cytometry data analysis
install.packages(c("flowCore", "flowWorkspace", "ggcyto"))

# Advanced analysis packages
install.packages(c("FlowSOM", "Rtsne", "umap"))

# Visualization and data manipulation
install.packages(c("ggplot2", "dplyr", "viridis"))

Loading Your First CyTOF Dataset

Mass cytometry data analysis begins with proper data import. R's flowCore package handles FCS files efficiently:

library(flowCore)
library(dplyr)

# Load single FCS file for mass cytometry data analysis
cytometry_data <- read.FCS("your_cytof_file.fcs")

# Examine data structure
print(paste("Cells analyzed:", nrow(cytometry_data)))
print(paste("Parameters measured:", ncol(cytometry_data)))

Quality Control: The Foundation of Reliable Mass Cytometry Data Analysis

Professional mass cytometry data analysis requires rigorous quality control to ensure reliable results. R provides comprehensive tools for data quality assessment:

# Basic quality metrics for mass cytometry data analysis
cell_counts <- nrow(cytometry_data)
parameter_names <- colnames(cytometry_data)

# Identify potential issues
zero_counts <- sum(cytometry_data@exprs == 0)
negative_values <- sum(cytometry_data@exprs < 0)

cat("Quality Control Summary for Mass Cytometry Data Analysis:\n")
cat("Total cells:", cell_counts, "\n")
cat("Zero values detected:", zero_counts, "\n")
cat("Negative values:", negative_values, "\n")

🔍 Understanding Your Mass Cytometry Dataset Structure

Effective mass cytometry data analysis requires thorough understanding of your dataset's composition. CyTOF experiments typically measure 30-50 parameters simultaneously, creating high-dimensional datasets that demand specialized analytical approaches.

Exploring Parameter Information

# Examine parameter details for mass cytometry data analysis
parameter_info <- cytometry_data@parameters@data
print(parameter_info[, c("name", "desc")])

# Identify metal channels vs. other parameters
metal_channels <- grep("^[0-9]+[A-Za-z]+", parameter_info$name, value = TRUE)
cat("Metal channels identified:", length(metal_channels), "\n")

Data Transformation for Mass Cytometry Data Analysis

Raw mass cytometry data analysis requires appropriate transformation to handle the wide dynamic range typical of CyTOF measurements:

# Arcsinh transformation for mass cytometry data analysis
cofactor <- 5  # Standard cofactor for CyTOF data
transformed_data <- asinh(cytometry_data@exprs / cofactor)

# Create transformed flowFrame
cytometry_transformed <- cytometry_data
cytometry_transformed@exprs <- transformed_data

🎯 Master Complete Mass Cytometry Data Analysis with Our Video Course

This foundational knowledge is just the beginning! Our comprehensive video training course provides step-by-step guidance through every aspect of R-based cytometry analysis. Watch, learn, and master advanced techniques with our expert-led video tutorials.

                                🎬
                                Professional Video Training: Clear, step-by-step video tutorials you can pause and rewatch
                            

                                💻
                                Hands-on Demonstrations: Real cytometry analysis workflows with live coding sessions
                            

                                📱
                                Learn at Your Pace: Online access allows you to master skills on your schedule
                            

Watch Video Course → View Pricing Options Continue Tutorial ↓

🧬 Advanced Clustering and Population Identification in Mass Cytometry Data Analysis

Moving beyond manual gating, sophisticated clustering algorithms revolutionize mass cytometry data analysis by automatically identifying cell populations with unprecedented precision. These computational approaches unlock hidden cellular diversity that traditional methods often miss, making them essential for comprehensive mass cytometry data analysis workflows.

🎯 Why Automated Clustering Transforms Mass Cytometry Data Analysis

❌ Traditional Manual Gating

Limited to 2-3 parameters simultaneously
Subjective bias in gate placement
Time-consuming for large datasets
Misses rare cell populations
Difficult to reproduce across analysts

✅ Automated Clustering in R

Analyzes all 30-50 parameters simultaneously
Objective, data-driven population identification
Rapid analysis of millions of cells
Discovers rare and novel populations
Completely reproducible results

🔬 FlowSOM: Self-Organizing Maps for Mass Cytometry Data Analysis

FlowSOM represents the gold standard for mass cytometry data analysis clustering, using self-organizing maps to identify cell populations based on high-dimensional similarity patterns.

Why FlowSOM Excels in Mass Cytometry Data Analysis:

High-dimensional clustering: Handles 40+ parameters without dimensionality reduction
Hierarchical organization: Creates interpretable population hierarchies
Scalable performance: Efficiently processes millions of cells
Visual interpretation: Generates intuitive heatmaps and trees

R - FlowSOM Implementation

# FlowSOM clustering for mass cytometry data analysis
library(FlowSOM)
library(flowCore)

# Prepare data for FlowSOM analysis
# Select markers for clustering (exclude time, event length, etc.)
clustering_markers <- c("CD45", "CD3", "CD4", "CD8", "CD19", "CD56", 
                       "CD14", "CD16", "CD25", "CD127", "PD1", "Tim3")

# Create FlowSOM object for mass cytometry data analysis
flowsom_result <- FlowSOM(cytometry_transformed,
                         colsToUse = clustering_markers,
                         xdim = 10, ydim = 10,  # Grid size
                         nClus = 20)            # Number of metaclusters

# Extract cluster assignments
cluster_assignments <- GetClusters(flowsom_result)

# Add cluster information to original data
cytometry_data$cluster <- cluster_assignments

# Generate FlowSOM visualization
PlotStars(flowsom_result, 
          markers = clustering_markers,
          main = "Mass Cytometry Data Analysis - FlowSOM Results")

🌟 UMAP and t-SNE: Dimensionality Reduction for Mass Cytometry Data Analysis

While clustering identifies populations, dimensionality reduction techniques like UMAP and t-SNE create powerful visualizations that reveal the relationships between cell populations in your mass cytometry data analysis.

🗺️ UMAP for Mass Cytometry Data Analysis

Best for: Preserving global structure and continuous trajectories

Maintains global data relationships
Faster computation than t-SNE
Better for trajectory analysis
Consistent results across runs

R - UMAP Implementation

# UMAP for mass cytometry data analysis visualization
library(umap)
library(ggplot2)

# Prepare data matrix for UMAP
umap_data <- cytometry_transformed@exprs[, clustering_markers]

# Configure UMAP parameters for mass cytometry data analysis
umap_config <- umap.defaults
umap_config$n_neighbors <- 15
umap_config$min_dist <- 0.1
umap_config$metric <- "euclidean"

# Generate UMAP embedding
umap_result <- umap(umap_data, config = umap_config)

# Create visualization dataframe
umap_df <- data.frame(
  UMAP1 = umap_result$layout[,1],
  UMAP2 = umap_result$layout[,2],
  Cluster = as.factor(cluster_assignments)
)

# Create publication-quality UMAP plot
ggplot(umap_df, aes(x = UMAP1, y = UMAP2, color = Cluster)) +
  geom_point(size = 0.5, alpha = 0.6) +
  theme_minimal() +
  labs(title = "Mass Cytometry Data Analysis - UMAP Visualization",
       subtitle = "Cell populations identified by FlowSOM clustering") +
  guides(color = guide_legend(override.aes = list(size = 3, alpha = 1)))

🎯 t-SNE for Mass Cytometry Data Analysis

Best for: Revealing local neighborhood structures and rare populations

Excellent for rare cell detection
Clear population separation
Highlights local structures
Standard in cytometry field

R - t-SNE Implementation

# t-SNE for mass cytometry data analysis visualization
library(Rtsne)

# Sample data for t-SNE (computational efficiency)
sample_size <- min(50000, nrow(umap_data))
sample_indices <- sample(1:nrow(umap_data), sample_size)
tsne_data <- umap_data[sample_indices, ]

# Configure t-SNE parameters for mass cytometry data analysis
tsne_result <- Rtsne(tsne_data,
                     dims = 2,
                     perplexity = 30,
                     max_iter = 1000,
                     check_duplicates = FALSE)

# Create t-SNE visualization dataframe
tsne_df <- data.frame(
  tSNE1 = tsne_result$Y[,1],
  tSNE2 = tsne_result$Y[,2],
  Cluster = as.factor(cluster_assignments[sample_indices])
)

# Generate publication-ready t-SNE plot
ggplot(tsne_df, aes(x = tSNE1, y = tSNE2, color = Cluster)) +
  geom_point(size = 0.5, alpha = 0.7) +
  theme_minimal() +
  labs(title = "Mass Cytometry Data Analysis - t-SNE Visualization",
       subtitle = "High-dimensional population structure revealed") +
  theme(legend.position = "right")

📊 Population Characterization and Validation

Successful mass cytometry data analysis requires thorough characterization of identified populations to ensure biological relevance and reproducibility.

Marker Expression Profiling

Generate comprehensive heatmaps showing median marker expression across all identified populations in your mass cytometry data analysis.

Population Frequency Analysis

Calculate and compare population frequencies across experimental conditions to identify treatment-responsive cell types.

Statistical Validation

Apply appropriate statistical tests to validate population differences and control for multiple comparisons.

R - Population Characterization

# Population characterization for mass cytometry data analysis
library(dplyr)
library(pheatmap)

# Calculate median marker expression per cluster
cluster_medians <- cytometry_data %>%
  group_by(cluster) %>%
  summarise_at(clustering_markers, median, na.rm = TRUE)

# Create expression heatmap matrix
heatmap_matrix <- as.matrix(cluster_medians[,-1])
rownames(heatmap_matrix) <- paste("Cluster", cluster_medians$cluster)

# Generate publication-quality heatmap
pheatmap(heatmap_matrix,
         scale = "column",
         clustering_distance_rows = "euclidean",
         clustering_method = "ward.D2",
         color = colorRampPalette(c("blue", "white", "red"))(100),
         main = "Mass Cytometry Data Analysis - Population Characterization",
         fontsize = 10)

# Calculate population frequencies
population_frequencies <- table(cluster_assignments) / length(cluster_assignments) * 100
print("Population frequencies (%):")
print(round(population_frequencies, 2))

💡 Expert Tips for Advanced Mass Cytometry Data Analysis

🎯

Clustering Parameter Optimization

Start with standard parameters but optimize grid size and cluster numbers based on your specific dataset complexity. Monitor cluster stability across parameter ranges.

🔍

Rare Population Detection

Combine multiple clustering approaches to ensure rare population discovery. Use t-SNE for visualization but validate with robust clustering methods like FlowSOM.

📈

Reproducibility Validation

Test clustering stability by running analyses multiple times with slightly different parameters. Consistent populations indicate robust biological signals.

🚀 Master Advanced Techniques with Our Video Training Course

You've learned to identify and characterize cell populations in your mass cytometry data analysis. Ready to see these techniques in action? Our comprehensive video course demonstrates every step with real datasets and expert commentary.

🎥 Watch Real Analysis Sessions: See FlowSOM, UMAP, and clustering performed on actual research data

🔬 Oncology Applications: Specialized modules for tumor microenvironment and immunotherapy analysis

⚡ Master in One Hour: Efficient video tutorials designed for busy researchers

Access Video Course → Compare Plans Continue to Statistics ↓

📊 Statistical Analysis and Publication-Quality Visualizations for Mass Cytometry Data Analysis

Transform your mass cytometry data analysis into compelling research narratives through rigorous statistical testing and publication-ready visualizations. This final section demonstrates how to communicate your cytometry findings with statistical confidence and visual impact that meets journal publication standards.

🎯 Statistical Testing Framework for Mass Cytometry Data Analysis

Proper statistical analysis is crucial for mass cytometry data analysis to ensure reproducible and meaningful biological conclusions. Different experimental designs require specific statistical approaches to control for multiple comparisons and account for the high-dimensional nature of cytometry data.

🔬 Experimental Design Considerations

Paired vs. Unpaired Comparisons: Choose appropriate tests based on experimental design
Multiple Testing Correction: Account for testing multiple cell populations simultaneously
Effect Size Calculation: Report biological significance alongside statistical significance
Sample Size Planning: Ensure adequate power for detecting meaningful differences

R - Statistical Testing Framework

# Statistical analysis framework for mass cytometry data analysis
library(dplyr)
library(broom)
library(ggplot2)

# Prepare data with experimental conditions
# Assume we have treatment vs control comparison
cytometry_stats <- cytometry_data %>%
  mutate(
    condition = case_when(
      grepl("treatment", sample_id) ~ "Treatment",
      grepl("control", sample_id) ~ "Control",
      TRUE ~ "Unknown"
    )
  )

# Calculate population frequencies per sample
population_frequencies <- cytometry_stats %>%
  group_by(sample_id, condition, cluster) %>%
  summarise(count = n(), .groups = "drop") %>%
  group_by(sample_id, condition) %>%
  mutate(
    total_cells = sum(count),
    frequency = count / total_cells * 100
  )

# Perform statistical testing for each population
statistical_results <- population_frequencies %>%
  group_by(cluster) %>%
  do(
    test_result = t.test(frequency ~ condition, data = ., var.equal = FALSE),
    effect_size = cohen.d(frequency ~ condition, data = .)
  ) %>%
  mutate(
    p_value = map_dbl(test_result, ~ .x$p.value),
    mean_diff = map_dbl(test_result, ~ diff(.x$estimate)),
    cohens_d = map_dbl(effect_size, ~ .x$estimate)
  ) %>%
  select(cluster, p_value, mean_diff, cohens_d)

# Apply multiple testing correction
statistical_results$p_adjusted <- p.adjust(statistical_results$p_value, 
                                         method = "fdr")

# Identify significant populations
significant_populations <- statistical_results %>%
  filter(p_adjusted < 0.05, abs(cohens_d) > 0.5) %>%
  arrange(p_adjusted)

print("Significantly different populations in mass cytometry data analysis:")
print(significant_populations)

📈 Advanced Visualization Techniques for Mass Cytometry Data Analysis

Publication-quality visualizations transform complex mass cytometry data analysis results into clear, compelling narratives that effectively communicate your research findings to scientific audiences.

🌡️ Heatmaps for Population Comparison

Create comprehensive heatmaps showing marker expression patterns across all identified populations in your mass cytometry data analysis.

R - Advanced Heatmap Visualization

# Advanced heatmap for mass cytometry data analysis
library(ComplexHeatmap)
library(circlize)
library(RColorBrewer)

# Calculate Z-scores for population expression
population_expression <- cytometry_data %>%
  group_by(cluster) %>%
  summarise_at(clustering_markers, median, na.rm = TRUE)

# Create Z-score matrix
expression_matrix <- as.matrix(population_expression[,-1])
rownames(expression_matrix) <- paste("Population", population_expression$cluster)

# Calculate Z-scores for better visualization
zscore_matrix <- t(scale(t(expression_matrix)))

# Create annotation for significant populations
row_annotation <- rowAnnotation(
  Significant = ifelse(population_expression$cluster %in% significant_populations$cluster,
                      "Yes", "No"),
  col = list(Significant = c("Yes" = "#e74c3c", "No" = "#95a5a6"))
)

# Generate publication-quality heatmap
publication_heatmap <- Heatmap(
  zscore_matrix,
  name = "Z-score",
  col = colorRamp2(c(-2, 0, 2), c("blue", "white", "red")),
  clustering_distance_rows = "euclidean",
  clustering_method_rows = "ward.D2",
  show_row_names = TRUE,
  show_column_names = TRUE,
  row_names_gp = gpar(fontsize = 10),
  column_names_gp = gpar(fontsize = 10),
  heatmap_legend_param = list(title = "Expression\nZ-score"),
  right_annotation = row_annotation,
  column_title = "Mass Cytometry Data Analysis - Population Characterization"
)

# Display heatmap
draw(publication_heatmap)

📊 Treatment Effect Visualization

Generate compelling before/after comparisons and treatment effect visualizations that clearly demonstrate experimental outcomes in your mass cytometry data analysis.

R - Treatment Effect Plots

# Treatment effect visualization for mass cytometry data analysis
library(ggplot2)
library(ggpubr)
library(viridis)

# Create comprehensive treatment effect plot
treatment_plot <- population_frequencies %>%
  filter(cluster %in% significant_populations$cluster[1:6]) %>%  # Top 6 significant
  ggplot(aes(x = condition, y = frequency, fill = condition)) +
  geom_boxplot(alpha = 0.7, outlier.shape = NA) +
  geom_jitter(width = 0.2, alpha = 0.6, size = 2) +
  facet_wrap(~paste("Population", cluster), scales = "free_y", ncol = 3) +
  scale_fill_viridis_d(name = "Condition", option = "plasma", begin = 0.2, end = 0.8) +
  labs(
    title = "Mass Cytometry Data Analysis: Treatment Effects on Cell Populations",
    subtitle = "Significant changes in population frequencies",
    x = "Experimental Condition",
    y = "Population Frequency (%)",
    caption = "Error bars show 95% confidence intervals"
  ) +
  theme_minimal() +
  theme(
    plot.title = element_text(size = 16, face = "bold", hjust = 0.5),
    plot.subtitle = element_text(size = 12, hjust = 0.5),
    strip.text = element_text(size = 10, face = "bold"),
    axis.text.x = element_text(angle = 45, hjust = 1),
    legend.position = "bottom"
  ) +
  stat_compare_means(method = "t.test", label = "p.signif",
                    label.y.npc = 0.9, size = 4)

# Display treatment effect plot
print(treatment_plot)

# Save high-resolution version for publication
ggsave("mass_cytometry_treatment_effects.pdf", 
       treatment_plot, 
       width = 12, height = 8, 
       dpi = 300, device = "pdf")

🎨 Combined Dimensionality Reduction Visualization

Create sophisticated multi-panel visualizations combining UMAP/t-SNE with expression data to provide comprehensive views of your mass cytometry data analysis results.

R - Multi-Panel Publication Figure

# Multi-panel publication figure for mass cytometry data analysis
library(cowplot)
library(gridExtra)

# Panel A: UMAP with population clusters
panel_a <- ggplot(umap_df, aes(x = UMAP1, y = UMAP2, color = Cluster)) +
  geom_point(size = 0.5, alpha = 0.6) +
  scale_color_viridis_d(name = "Population") +
  theme_void() +
  theme(
    legend.position = "right",
    plot.title = element_text(size = 14, face = "bold")
  ) +
  labs(title = "A) Population Identification") +
  guides(color = guide_legend(override.aes = list(size = 3, alpha = 1)))

# Panel B: UMAP colored by treatment condition
panel_b <- umap_df %>%
  left_join(select(cytometry_stats, cluster, condition), by = c("Cluster" = "cluster")) %>%
  ggplot(aes(x = UMAP1, y = UMAP2, color = condition)) +
  geom_point(size = 0.5, alpha = 0.6) +
  scale_color_manual(values = c("Control" = "#3498db", "Treatment" = "#e74c3c"),
                    name = "Condition") +
  theme_void() +
  theme(
    legend.position = "right",
    plot.title = element_text(size = 14, face = "bold")
  ) +
  labs(title = "B) Treatment Distribution")

# Panel C: Population frequency comparison
panel_c <- significant_populations %>%
  slice_head(n = 8) %>%
  left_join(population_frequencies, by = "cluster") %>%
  ggplot(aes(x = reorder(paste("Pop", cluster), -abs(mean_diff)), 
             y = frequency, fill = condition)) +
  geom_boxplot() +
  scale_fill_manual(values = c("Control" = "#3498db", "Treatment" = "#e74c3c"),
                   name = "Condition") +
  labs(
    title = "C) Significant Population Changes",
    x = "Cell Population",
    y = "Frequency (%)"
  ) +
  theme_minimal() +
  theme(
    axis.text.x = element_text(angle = 45, hjust = 1),
    plot.title = element_text(size = 14, face = "bold"),
    legend.position = "bottom"
  )

# Panel D: Statistical summary
stats_summary <- significant_populations %>%
  slice_head(n = 8) %>%
  ggplot(aes(x = reorder(paste("Pop", cluster), -abs(cohens_d)), 
             y = cohens_d)) +
  geom_col(fill = "#52b788", alpha = 0.8) +
  geom_text(aes(label = paste("p =", format(p_adjusted, digits = 3))),
           hjust = -0.1, size = 3) +
  coord_flip() +
  labs(
    title = "D) Effect Sizes",
    x = "Cell Population",
    y = "Cohen's d"
  ) +
  theme_minimal() +
  theme(plot.title = element_text(size = 14, face = "bold"))

# Combine all panels into publication figure
publication_figure <- plot_grid(
  plot_grid(panel_a, panel_b, ncol = 2, labels = c("", "")),
  plot_grid(panel_c, panel_d, ncol = 2, labels = c("", "")),
  ncol = 1,
  rel_heights = c(1, 1)
)

# Add main title
final_figure <- plot_grid(
  ggdraw() + draw_label("Mass Cytometry Data Analysis: Comprehensive Results Overview", 
                       fontface = "bold", size = 18),
  publication_figure,
  ncol = 1,
  rel_heights = c(0.1, 1)
)

# Display and save publication figure
print(final_figure)
ggsave("mass_cytometry_publication_figure.pdf", 
       final_figure, width = 16, height = 12, dpi = 300)

📝 Reporting Standards for Mass Cytometry Data Analysis

Professional mass cytometry data analysis requires adherence to established reporting standards that ensure reproducibility and transparency in scientific publications.

✅ Essential Reporting Elements

Sample Preparation: Detailed protocols for cell isolation and staining

Instrument Settings: Acquisition parameters and quality control measures

Analysis Workflow: Complete computational pipeline with parameters

Statistical Methods: Tests used and multiple comparison corrections

Data Availability: Raw FCS files and analysis scripts

🎯 Publication Best Practices

Reproducible Analysis: Provide complete R scripts with session information
Quality Control Metrics: Report cell viability, antibody validation, and batch effects
Statistical Power: Include sample size calculations and effect size reporting
Visualization Standards: Use consistent color schemes and clear legends
Method Validation: Compare automated results with manual gating when possible

R - Session Information for Reproducibility

# Generate comprehensive session information for mass cytometry data analysis
# Include this in supplementary materials for complete reproducibility

# Session information
cat("=== Mass Cytometry Data Analysis Session Information ===\n")
print(sessionInfo())

# Package versions for key cytometry packages
cytometry_packages <- c("flowCore", "FlowSOM", "ggplot2", "dplyr", 
                        "ComplexHeatmap", "umap", "Rtsne")

cat("\n=== Key Package Versions ===\n")
for(pkg in cytometry_packages) {
  if(pkg %in% rownames(installed.packages())) {
    cat(paste(pkg, ":", packageVersion(pkg), "\n"))
  }
}

# Analysis parameters summary
cat("\n=== Analysis Parameters ===\n")
cat("FlowSOM grid size: 10x10\n")
cat("Number of metaclusters: 20\n")
cat("UMAP neighbors: 15\n")
cat("UMAP min_dist: 0.1\n")
cat("t-SNE perplexity: 30\n")
cat("Statistical correction: FDR\n")
cat("Significance threshold: p < 0.05\n")
cat("Effect size threshold: |Cohen's d| > 0.5\n")

# Export analysis summary
analysis_summary <- list(
  total_cells = nrow(cytometry_data),
  populations_identified = length(unique(cluster_assignments)),
  significant_populations = nrow(significant_populations),
  samples_analyzed = length(unique(cytometry_data$sample_id)),
  markers_used = clustering_markers
)

# Save analysis metadata
saveRDS(analysis_summary, "mass_cytometry_analysis_metadata.rds")
cat("\n=== Analysis Summary Saved ===\n")
cat("Metadata saved to: mass_cytometry_analysis_metadata.rds\n")

🏆 Congratulations! You've Mastered Mass Cytometry Data Analysis

You now possess the complete toolkit for professional mass cytometry data analysis using R. From data import and quality control through advanced clustering, statistical analysis, and publication-quality visualization - you have the skills to transform complex cytometry datasets into meaningful biological insights.

Skills You've Mastered:

📊 Statistical Analysis & Multiple Testing Correction

🎨 Publication-Quality Visualization Creation

🔬 Advanced Population Characterization

📝 Reproducible Research Standards

🚀 Take Your Mass Cytometry Data Analysis to the Next Level

Ready to apply these advanced techniques to your own research? Our comprehensive training courses provide hands-on practice with real datasets, personalized feedback, and advanced techniques including oncology-specific applications and immunotherapy monitoring.

🎓 Complete Video Training Course

Expert-led video tutorials with live demonstrations
Real research datasets from published studies
Oncology & immunotherapy applications with specialized modules
Screen recordings of actual R coding sessions
Download and practice with provided datasets

💰 Exceptional Value & Access

Basic Plan: €49/year - Essential video tutorials
VIP Plan: €69/year - Complete video library access
No expensive software licenses needed
Unlimited video access - watch anytime, anywhere
Lifetime updates with new video content

Start Video Training → View All Plans