@techreport{oai:ipsj.ixsq.nii.ac.jp:00229528, author = {奥, 牧人 and Makito, Oku}, issue = {6}, month = {Nov}, note = {一般に,scRNA-seq のデータは多くの 0 の値を含んでおり,各遺伝子の発現量はゼロ過剰な分布を示す.そのため,scRNA-seq データの分布の表示にはバイオリンプロットがよく用いられる.これは多峰分布の形を表せるためである.しかし,0 の値の割合が極めて大きい場合に,バイオリンプロットでは 0 のピークが大きくなり過ぎるため,非ゼロの値の分布が見づらくなる.この問題を解決するため,本研究では,バイオリンプロットに代わる scRNA-seq データのゼロ過剰分布の表示法としてクラリネットプロットを提案する.クラリネットプロットでは各分布をクラリネットのような形で表す.長軸方向は分位数に相当し,幅は各データ値の大きさを表す.末尾の直線部分が 0 の値に相当する.クラリネットプロットを使えば,0 の値の割合と非ゼロの値の分布を同時かつ効果的に表示出来る.人工データと実データへの適用例を示す., Generally, scRNA-seq data contain many 0 values, and the expression of each gene shows a zero-inflated distribution. Therefore, violin plots are usually used to display distributions of scRNA-seq data because they can represent the shape of multi-modal distributions. However, when the proportion of 0 values is very large, the 0 peak becomes too large in a violin plot, and the shape of the distribution of non-zero values becomes difficult to see. To resolve this issue, in this study, clarinet plots are proposed as alternative to violin plots to display zero-inflated distribution of scRNA-seq data. In clarinet plots, each distribution is represented by a clarinet-like shape. The long axis corresponds to quantile, and the width represents the magnitude of each data value. The straight line at the end corresponds to 0 values. By using a clarinet plot, the proportion of 0 values and the distribution of nonzero values can be displayed simultaneously and effectively. Examples of application to artificial data and real data are shown.}, title = {クラリネットプロット:バイオリンプロットに代わるscRNA-seqデータのゼロ過剰分布の表示法}, year = {2023} }