zhongwei/gh-k-dense-ai-claude-scientific-skills-scientific-skills

Files

Zhongwei Li f0bd18fb4e Initial commit

2025-11-30 08:30:10 +08:00

7.5 KiB

Raw Blame History

Transformations

Aeon provides extensive transformation capabilities for preprocessing, feature extraction, and representation learning from time series data.

Transformation Types

Aeon distinguishes between:

CollectionTransformers: Transform multiple time series (collections)
SeriesTransformers: Transform individual time series

Collection Transformers

Convolution-Based Feature Extraction

Fast, scalable feature generation using random kernels:

RocketTransformer - Random convolutional kernels
MiniRocketTransformer - Simplified ROCKET for speed
MultiRocketTransformer - Enhanced ROCKET variant
HydraTransformer - Multi-resolution dilated convolutions
MultiRocketHydraTransformer - Combines ROCKET and Hydra
ROCKETGPU - GPU-accelerated variant

Use when: Need fast, scalable features for any ML algorithm, strong baseline performance.

Statistical Feature Extraction

Domain-agnostic features based on time series characteristics:

Catch22 - 22 canonical time-series characteristics
TSFresh - Comprehensive automated feature extraction (100+ features)
TSFreshRelevant - Feature extraction with relevance filtering
SevenNumberSummary - Descriptive statistics (mean, std, quantiles)

Use when: Need interpretable features, domain-agnostic approach, or feeding traditional ML.

Dictionary-Based Representations

Symbolic approximations for discrete representations:

SAX - Symbolic Aggregate approXimation
PAA - Piecewise Aggregate Approximation
SFA - Symbolic Fourier Approximation
SFAFast - Optimized SFA
SFAWhole - SFA on entire series (no windowing)
BORF - Bag-of-Receptive-Fields

Use when: Need discrete/symbolic representation, dimensionality reduction, interpretability.

Shapelet-Based Features

Discriminative subsequence extraction:

RandomShapeletTransform - Random discriminative shapelets
RandomDilatedShapeletTransform - Dilated shapelets for multi-scale
SAST - Scalable And Accurate Subsequence Transform
RSAST - Randomized SAST

Use when: Need interpretable discriminative patterns, phase-invariant features.

Interval-Based Features

Statistical summaries from time intervals:

RandomIntervals - Features from random intervals
SupervisedIntervals - Supervised interval selection
QUANTTransformer - Quantile-based interval features

Use when: Predictive patterns localized to specific windows.

Preprocessing Transformations

Data preparation and normalization:

MinMaxScaler - Scale to [0, 1] range
Normalizer - Z-normalization (zero mean, unit variance)
Centerer - Center to zero mean
SimpleImputer - Fill missing values
DownsampleTransformer - Reduce temporal resolution
Tabularizer - Convert time series to tabular format

Use when: Need standardization, missing value handling, format conversion.

Specialized Transformations

Advanced analysis methods:

MatrixProfile - Computes distance profiles for pattern discovery
DWTTransformer - Discrete Wavelet Transform
AutocorrelationFunctionTransformer - ACF computation
Dobin - Distance-based Outlier BasIs using Neighbors
SignatureTransformer - Path signature methods
PLATransformer - Piecewise Linear Approximation

Class Imbalance Handling

ADASYN - Adaptive Synthetic Sampling
SMOTE - Synthetic Minority Over-sampling
OHIT - Over-sampling with Highly Imbalanced Time series

Use when: Classification with imbalanced classes.

Pipeline Composition

CollectionTransformerPipeline - Chain multiple transformers

Series Transformers

Transform individual time series (e.g., for preprocessing in forecasting).

Statistical Analysis

AutoCorrelationSeriesTransformer - Autocorrelation
StatsModelsACF - ACF using statsmodels
StatsModelsPACF - Partial autocorrelation

Smoothing and Filtering

ExponentialSmoothing - Exponentially weighted moving average
MovingAverage - Simple or weighted moving average
SavitzkyGolayFilter - Polynomial smoothing
GaussianFilter - Gaussian kernel smoothing
BKFilter - Baxter-King bandpass filter
DiscreteFourierApproximation - Fourier-based filtering

Use when: Need noise reduction, trend extraction, or frequency filtering.

Dimensionality Reduction

PCASeriesTransformer - Principal component analysis
PlASeriesTransformer - Piecewise Linear Approximation