塩こうじ
AUTHOR

塩こうじ

こんにちは!塩こうじです! 東京大学大学院を卒業後、製薬企業でバイオインフォマティクスを担当。 日々学んだことをアウトプットするためにブログをはじめました! バイオインフォが専門分野でない方でもわかりやすいブログを目指しています!

  • 2023-01-27

【RNA-seq解析】よく使われるファイル形式まとめ!【FASTQ, BAM, SAM, SRA, GTF, GFF, BED】

はじめに RNA-seq解析では本当にたくさんのファイル形式を扱うことになります! どのファイルフォーマットがどんなデータを保存していて、どんな形式で記載されていて、この列は何を意味しているのかを把握するのは本当に大変で、私も忘れるたびにいちいち調べていました。。。 この記事ではRNA-seq解析で […]

  • 2023-01-20

伝わりやすい研究発表スライド作成のコツ!【PowerPoint】

はじめに こんにちは! 今回は伝わりやすい研究発表スライドの作成のためのコツをまとめてみました! この記事ではシンプルで可読性が高く、見ている人に伝わりやすいデザインの作り方をまとめています! スライドの作り方やデザインは「センスが良くないとできない」と思っている方もおられると思いますが、これだけは […]

  • 2023-01-20

深層学習モデルで分子ドッキング!GNINAの概要

今回は深層学習モデルでドッキングの性能を向上させたと話題のGNINAについてです! 最近使用する機会があって、すごく使用感が良かったのでぜひご紹介したいと思います! 紹介する内容は以下の論文をベースにしています! McNutt, A.T., Francoeur, P., Aggarwal, R. e […]

  • 2021-06-20

Python】Optunaパッケージの紹介!PostgresDBを使った並列分散処理で高速化!【Optuna】

前回はOptunaを使った簡単な例の最適化とニューラルネットワークの最適化を行ってみました! Optunaの凄さは前回だけでも十分伝わったと思うのですが、実はOptunaの本領はPostgressDBなどをバックエンドに使用したとき発揮されます! PostgressDBをOptunaと一緒に使うと以 […]

  • 2021-06-07

【Python】ハイパーパラメータ調整でlightgbmやニューラルネットワークの最適化!Optunaパッケージの紹介!【Optuna】

ニューラルネットワークやLightgbmでモデルを作成する際に最も時間のかかるのはハイパーパラメータの調整ではないでしょうか? 最適なものを得ることができればそれだけでモデルの性能をぐんと上げることができる一方で、その最適な値を探索するのはすごく苦労する作業です。。。 今回はそんな面倒だけどとても重 […]

  • 2021-06-07

【Python】Kaggleで引っ張りだこ!lightgbmの2種類の使い方!Training APIとScikit-learn API!【lightgbm】

Kaggleに挑戦したことのある方はKernelsでlightgbmを使用したものを見ることが多いと思います! lighthbmは計算速度も速い、予測精度も高い、さらに決定木をベースにしたアルゴリズムのため前処理もほとんど必要ないという三拍子揃っためちゃくちゃ強力なモデルです! Kaggleなどのコ […]

  • 2020-10-01

【R】ggplotとdendextendできれいなデンドログラムを描く!

デンドログラムって見た目のカスタマイズがすごく難しいですよね。。。R標準のplotだとダサいし、かと言ってggplot2で描こうとするとあまりにも難しいし。。。 そこで今回は見た目のカスタマイズがすごく簡単にできて、さらにggplotによる細かい調整も可能な方法を紹介します! それがggplotとd […]

  • 2023-01-22

【WGCNA】DEG解析じゃ満足できない?RでWGCNA解析 -Part3-モジュール検出

Part1では正規化などのデータの前処理、Part2ではネットワークの構築とデンドログラムの作成を行ってきました! 今回はWGCNAで最も重要なパートであるモジュール検出を行います! モジュール検出は自分で設定しなければならないパラメータが多くあり、解析者によって得られる結果が大きく異なります。です […]