ラマン分光分析アプリケーション
クイックスタート
はじめに(Getting Started)
システム要件(目安)
インストール方法
クイックスタート(最初の分析まで)
学習パス(目安)
インストールガイド
1) Windows(ポータブル版)
2) ソースから実行(開発者向け)
前提
手順(例)
うまくいかない場合
クイックスタートガイド
📋 前提条件
🚀 5分間チュートリアル
ステップ1: アプリケーションを起動(30秒)
ステップ2: データをインポート(1分)
ステップ3: 前処理を適用(2分)
ステップ4: データを分析(1.5分)
ステップ5: 結果をエクスポート(30秒)
📊 視覚的ワークフロー
💡 次のステップ
中級機能
チュートリアル
🎯 一般的なワークフロー
ワークフロー1: 探索的分析
ワークフロー2: グループ比較
ワークフロー3: 分類モデル
🔑 キーコンセプト
スペクトルデータ
前処理
分析手法
⚙️ 推奨設定
初心者向け
上級者向け
🐛 一般的な問題
問題: データがロードされない
問題: 前処理結果が悪い
問題: PCAの説明分散が低い
問題: 機械学習の精度が低い
📖 学習リソース
ドキュメント
チュートリアル
サンプルデータ
💬 ヘルプが必要ですか?
サポートオプション
🎓 次のステップ
🌟 ベストプラクティス
データ管理
前処理
分析
機械学習
ユーザーガイド
ユーザーガイド
📖 このガイドについて
🎯 対象読者
初心者
中級ユーザー
上級ユーザー
📚 ガイドセクション
1. データ管理
2. スペクトル処理
3. データ解析
4. 機械学習
5. エクスポートと共有
🚀 アプリケーションインターフェース
メイン画面
1. ホームタブ
2. データパッケージタブ
3. 前処理タブ
4. 分析タブ
5. 機械学習タブ
🔧 一般的なワークフロー
ワークフロー1: 基本的な探索的分析
ワークフロー2: グループ比較
ワークフロー3: 機械学習分類
💡 ベストプラクティス
データ管理
✅ 推奨事項
❌ 避けるべき事項
前処理
✅ 推奨事項
❌ 避けるべき事項
分析
✅ 推奨事項
❌ 避けるべき事項
機械学習
✅ 推奨事項
❌ 避けるべき事項
🎯 ユースケース別ガイド
ユースケース1: 研究開発
ユースケース2: 品質管理
ユースケース3: 医療診断
ユースケース4: 教育
🔍 高度なトピック
カスタムパイプライン
バッチ処理
プログラマティックアクセス
📊 データ形式
入力形式
出力形式
🆘 ヘルプとサポート
ドキュメントリソース
コミュニティサポート
フィードバック
🔄 次のステップ
インターフェース概要
目次
メインウィンドウ
構成要素(概要)
ホームタブ
データパッケージタブ
前処理タブ
分析タブ
機械学習タブ
データ管理ガイド
📋 目次
データのインポート
サポートされている形式
基本的なインポート手順
方法1: メニューから
方法2: ドラッグ&ドロップ
方法3: データパッケージタブから
複数ファイルのインポート
バッチインポート
自動命名規則
インポート設定
高度なオプション
データ形式
標準CSV形式
推奨フォーマット
転置形式(オプション)
Excel形式
メタデータの追加
メタデータファイル
Excelでのメタデータ
データ検証
自動検証
手動検証
グループ管理
グループの作成
方法1: 手動作成
方法2: ファイル名から自動
方法3: メタデータから
グループの編集
名前の変更
サンプルの移動
グループの結合
グループの分割
グループの色とスタイル
カラーコーディング
プロットスタイル
データの検証と品質管理
品質メトリクス
S/N比(信号対雑音比)
ベースライン安定性
ピーク検出
外れ値の検出
統計的外れ値
スペクトル比較
視覚的確認
データのクリーニング
外れ値の除去
欠損値の処理
重複の除去
プロジェクト管理
プロジェクトの保存
基本的な保存
自動保存
バージョン管理
プロジェクトの読み込み
プロジェクトのエクスポート
完全なエクスポート
テンプレートの使用
テンプレートの作成
テンプレートの使用
データのエクスポート
個別スペクトルのエクスポート
CSV形式
Excel形式
バッチエクスポート
すべてのスペクトル
グループごと
前処理済みデータのエクスポート
分析結果のエクスポート
PCA結果
統計分析結果
機械学習モデル
ベストプラクティス
データ命名規則
推奨されるファイル命名
データ構造
フォルダ構成
データバックアップ
推奨バックアップ戦略
メタデータ管理
重要なメタデータ
データ品質保証
測定前チェックリスト
測定後チェックリスト
データインポート後チェックリスト
🔗 関連ドキュメント
前処理ガイド
📋 目次
前処理の重要性
なぜ前処理が必要か
1. 蛍光バックグラウンド
2. ノイズ
3. スケールの違い
4. オフセット
前処理の効果
前処理前
前処理後
前処理パイプライン
パイプラインの構築
基本的な流れ
UIでのパイプライン構築
プレビュー機能の使用
ベースライン補正
AsLS(Asymmetric Least Squares)
原理
パラメータ
実用例
AirPLS(Adaptive Iteratively Reweighted Penalized Least Squares)
AsLSとの違い
パラメータ
使用例
Whittaker Smoother
特徴
パラメータ
スムージング
Savitzky-Golay フィルタ
原理
パラメータ
経験則
実用例
Gaussian スムージング
原理
パラメータ
使用例
Moving Average
特徴
パラメータ
正規化
ベクトルノルム(L2正規化)
原理
使用例
SNV(Standard Normal Variate)
原理
使用例
MSC(Multiplicative Scatter Correction)
原理
パラメータ
使用例
Min-Max 正規化
原理
使用例
最大値正規化
原理
使用例
微分
一次微分
原理
パラメータ(Savitzky-Golay微分)
使用例
注意点
二次微分
原理
使用例
高度な手法
EMSC(Extended Multiplicative Signal Correction)
特徴
FABC(Fast Adaptive Baseline Correction)
特徴
CDAE(Convolutional Denoising Autoencoder)
特徴
パイプライン最適化
一般的なパイプライン
パイプライン1: 探索的分析用
パイプライン2: 定量分析用
パイプライン3: 分類・識別用
パラメータの調整
体系的アプローチ
グリッドサーチ
結果の評価
視覚的評価
定量的評価
ケーススタディ
ケース1: 強い蛍光バックグラウンド
問題
解決策
ケース2: 非常にノイズが多いデータ
問題
解決策
ケース3: 粉末サンプル(散乱が大きい)
問題
解決策
ケース4: 微小な差の検出
問題
解決策
🔗 関連ドキュメント
データ解析ガイド
📋 目次
探索的データ解析
データの概要把握
基本統計量
スペクトルの可視化
ヒートマップ
次元削減
PCA(Principal Component Analysis)
原理
実行方法
スコアプロット
ローディングプロット
スクリープロット
バイプロット
UMAP(Uniform Manifold Approximation and Projection)
PCAとの比較
実行方法
使用ケース
t-SNE
特徴
パラメータ
注意点
クラスタリング
K-means
原理
実行方法
クラスター数の決定
階層的クラスタリング
原理
実行方法
デンドログラムの解釈
DBSCAN
特徴
パラメータ
使用例
統計分析
t検定
2群の比較
結果の解釈
ANOVA(Analysis of Variance)
3群以上の比較
多重比較
多重比較補正
問題
Bonferroni補正
FDR(False Discovery Rate)補正
使用方法
効果量
重要性
Cohen’s d
Eta-squared (η²)
相関分析
ピアソン相関
スペアマン相関
相関行列
ピーク解析
ピーク検出
ピークフィッティング
ピーク同定
結果の解釈
PCA結果の解釈
スコアプロット分析
ローディング解釈
クラスタリング結果の解釈
統計検定結果の解釈
レポート作成
レポート用エクスポート(現状)
カスタムレポート
図のエクスポート
🔗 関連ドキュメント
機械学習ガイド
📋 目次
機械学習の基礎
機械学習とは
学習パラダイム
教師あり学習
教師なし学習
ワークフロー
データ準備
データ分割
Train/Test分割
層化分割(Stratified Split)
クロスバリデーション
前処理パイプライン
アルゴリズム選択
Random Forest
特徴
主要パラメータ
使用例
SVM(Support Vector Machine)
特徴
主要パラメータ
使用例
XGBoost
特徴
主要パラメータ
使用例
ロジスティック回帰
特徴
パラメータ
使用例
モデルトレーニング
基本的なトレーニング
グリッドサーチ
効率的なグリッドサーチ
ランダムサーチ
モデル評価
分類メトリクス
精度(Accuracy)
適合率(Precision)
再現率(Recall / Sensitivity)
F1スコア
混同行列
ROC曲線とAUC
クロスバリデーション結果
ハイパーパラメータ調整
学習曲線
検証曲線
特徴量選択
特徴量の重要度
RFE(Recursive Feature Elimination)
分散閾値法
モデルの解釈
混同しやすいサンプルの分析
SHAP(予測の説明:SHapley Additive exPlanations)
予測と実運用
新しいデータへの予測
モデルの保存と読み込み
バッチ予測
モデルの更新
🔗 関連ドキュメント
ベストプラクティス(Best Practices)
目次
データ品質
サンプル準備
測定(データ取得)
キャリブレーション
前処理戦略
推奨の最小パイプライン
避けたいパターン
統計解析
機械学習
データリーク防止
最初に試すモデル
再現性
論文・報告
次に読む
分析手法
分析手法ドキュメント
📚 概要
🎯 手法カテゴリ
1. 前処理手法(40以上)
2. 探索的分析(6手法)
3. 統計分析(8カテゴリ)
4. 機械学習(4アルゴリズム)
🔍 手法選択ガイド
目的別推奨手法
データの探索
グループ分離の可視化
統計的差異検定
予測モデルの構築
📊 比較表
次元削減手法の比較
クラスタリング手法の比較
機械学習アルゴリズムの比較
🎓 理論的背景
なぜ前処理が重要か
次元削減の数学
統計検定の理論
機械学習の基礎理論
💡 実践的なヒント
前処理パイプラインの構築
分析結果の解釈
一般的な落とし穴
📚 詳細ドキュメント
🔗 関連リソース
前処理手法(日本語版)
探索的分析(日本語版)
統計分析(日本語版)
目次
ANOVA(分散分析)
モード(Simple / Grouped)
パラメータ
使い分けの目安
補足: 多重検定(Multiple testing)
機械学習(分析手法)(日本語版)
API リファレンス
API リファレンス(日本語版)
📌 関連ページ(日本語)
🔗 外部リンク
🆘 サポート
コアモジュール(日本語版)
ページ(日本語版)
コンポーネント(日本語版)
関数モジュール(日本語版)
ウィジェット(日本語版)
開発ガイド
開発者ガイド(日本語版)
✅ 前提条件(現状)
🚀 最小クイックスタート(from source)
🧪 簡易テスト(スモークテスト)
📌 関連ページ(日本語)
🔗 外部リンク
🆘 サポート
アーキテクチャ(日本語版)
貢献ガイド(日本語版)
ビルドシステム(日本語版)
テストガイド(日本語版)
追加リソース
変更履歴
[Unreleased]
ドキュメント
[1.0.0-alpha] - 2026-01-24
Added
コア機能
前処理(40+ 手法)
分析手法
機械学習
ビルドシステム
Fixed
2026年1月
2025年10月
Changed
Security
[0.1.0] - 2025-10-01
Added
リリースノート
バージョン 1.0.0-alpha
Contributors
よくある質問(FAQ)
📋 目次
一般的な質問
Q1: このアプリケーションは何ができますか?
Q2: 無料で使用できますか?
Q3: どのような研究分野に適していますか?
Q4: プログラミングの知識は必要ですか?
Q5: 他のソフトウェアと比較した利点は何ですか?
インストールとセットアップ
Q6: システム要件は何ですか?
Q7: インストール方法を教えてください
Q8: "ModuleNotFoundError"が表示されます
Q9: Windows で “VCRUNTIME140.dll が見つかりません” エラー
Q10: macOS で “破損しているため開けません” エラー
データのインポート
Q11: どのようなデータ形式がサポートされていますか?
Q12: データが正しくロードされません
Q13: 大きなデータセット(数千スペクトル)をロードできますか?
Q14: 複数のファイルを一度にインポートできますか?
Q15: スペクトルをグループ化する方法は?
前処理
Q16: どの前処理手法を使用すればよいですか?
Q17: AsLSの
lambda
と
p
パラメータの意味は?
Q18: 前処理後にピークが消えました
Q19: 前処理パイプラインを保存できますか?
Q20: バッチで複数のスペクトルに同じ前処理を適用できますか?
分析と結果
Q21: PCAの成分数はいくつにすべきですか?
Q22: PCAのスコアプロットで外れ値を見つけました。どうすればよいですか?
Q23: クラスタリングで最適なクラスター数を決定する方法は?
Q24: 統計検定のp値はどう解釈しますか?
Q25: 結果をエクスポートする方法は?
機械学習
Q26: どの機械学習アルゴリズムを選択すべきですか?
Q27: データをトレーニング/テストセットに分割する必要がありますか?
Q28: 混同行列の読み方を教えてください
Q29: モデルが過学習しているか確認する方法は?
Q30: 特徴量の重要度を確認できますか?
エラーとトラブルシューティング
Q31: "Memory Error"が表示されます
Q32: アプリケーションがクラッシュします
Q33: 図が表示されません
Q34: "Singular matrix"エラーが出ます
Q35: プロジェクトファイルが開けません
高度な使用方法
Q39: カスタム前処理手法を追加できますか?
Q40: Pythonスクリプトからアプリの機能を使用できますか?
Q41: バッチ処理を自動化できますか?
Q42: 他のソフトウェアとデータを交換できますか?
Q43: リアルタイムデータ取得はサポートされていますか?
Q44: クラウドでアプリケーションを実行できますか?
Q45: ヘルプやサポートを受けるには?
📚 追加リソース
学習資料
コミュニティリソース
開発者リソース
トラブルシューティングガイド
📋 目次
インストール問題
問題1: "Python not found"エラー
問題2: "Permission denied"インストールエラー
問題3: UVのインストールが失敗する
問題4: 依存関係の競合
起動とクラッシュ
問題5: アプリケーションが起動しない
問題6: 起動後すぐにクラッシュ
問題7: ランダムなクラッシュ
データロード問題
問題8: CSVファイルが読み込めない
問題9: “Memory Error” データロード時
問題10: スペクトルが正しく表示されない
前処理エラー
問題11: ベースライン補正が機能しない
問題12: スムージング後にピークが消える
問題13: 正規化が期待通りに機能しない
問題14: "Singular matrix"エラー
分析エラー
問題15: PCAで"explained variance"が低い
問題16: クラスタリングで意味のない結果
問題17: 統計検定で"すべてのp値が有意"
機械学習問題
問題18: モデルの精度が非常に低い(<60%)
問題19: トレーニング精度99%、テスト精度60% → 過学習
問題20: “ValueError: Found input variables with inconsistent numbers of samples”
問題21: XGBoostが非常に遅い
パフォーマンス問題
問題22: UI がフリーズする
問題23: メモリ使用量が増え続ける
問題24: 大きなファイルのエクスポートが遅い
UI/表示問題
問題25: 図が表示されない
問題26: フォントが正しく表示されない
問題27: ハイDPI画面で表示が小さい
エクスポート問題
問題28: Excelエクスポートが失敗する
問題29: 図のエクスポート品質が悪い
プラットフォーム固有の問題
Windows固有
問題30: “VCRUNTIME140.dll が見つかりません”
問題31: Windows Defenderがブロック
macOS固有
問題32: “開発元を確認できないため開けません”
問題33: macOS Big Sur以降でクラッシュ
Linux固有
問題34: "libGL error"エラー
問題35: Wayland vs X11の問題
🆘 それでも解決しない場合
ログの収集
バグレポートの作成
サポートを受ける
📚 関連リソース
用語集
A
AsLS(Asymmetric Least Squares)
AirPLS(Adaptive Iteratively Reweighted Penalized Least Squares)
ANOVA(Analysis of Variance)
API(Application Programming Interface)
B
Baseline Correction
Batch Processing
Biplot
Bonferroni Correction
C
CDAE(Convolutional Denoising Autoencoder)
Clustering
Cohen’s d
Confusion Matrix
Cross-Validation(CV)
D
DBSCAN(Density-Based Spatial Clustering of Applications with Noise)
Dendrogram
Dimensionality Reduction
E
Effect Size
Elbow Method
EMSC(Extended Multiplicative Signal Correction)
Eta-squared(η²)
F
F1-score
FABC(Fast Adaptive Baseline Correction)
False Discovery Rate(FDR)
Feature Engineering
Feature Importance
Feature Selection
Fluorescence
G
Gap Statistic
Gaussian Smoothing
Grid Search
H
Hierarchical Clustering
Hyperparameter Tuning
K
K-means
L
Learning Curve
Loading Plot
Logistic Regression
M
Machine Learning
Min-Max Normalization
MSC(Multiplicative Scatter Correction)
Multiple Comparison Correction
N
Neural Network
Normalization
O
Outlier Detection
Overfitting
P
PCA(Principal Component Analysis)
Peak Detection
Peak Fitting
Pipeline
Post-hoc Test
Precision
Preprocessing
R
Random Forest
Random Search
Recall
Regularization
RFE(Recursive Feature Elimination)
ROC Curve(Receiver Operating Characteristic Curve)
S
Savitzky-Golay
Scattering
Score Plot
Scree Plot
Silhouette Analysis
Smoothing
SNV(Standard Normal Variate)
Supervised Learning
SVM(Support Vector Machine)
T
t-SNE(t-Distributed Stochastic Neighbor Embedding)
t-test
Train/Test Split
U
UMAP(Uniform Manifold Approximation and Projection)
Underfitting
Unsupervised Learning
V
Validation Curve
Vector Norm
W
Wavenumber
Whittaker Smoothing
Workflow
X
XGBoost(eXtreme Gradient Boosting)
Z
Z-score
🔗 関連ドキュメント
参考文献(References)
目次
Raman Spectroscopy
Fundamentals
Medical Applications
Preprocessing Methods
Machine Learning
Software Libraries
Medical Applications
ラマン分光分析アプリケーション
索引
索引