したらばTOP ■掲示板に戻る■ 全部 1-100 最新50 | |

遠藤高帆博士の論文

1ふふふ:2014/10/08(水) 15:06:41
Quality control method for RNA-seq using single nucleotide polymorphism allele frequency

一塩基多型対立遺伝子頻度を用いたRNA-seqのための品質制御方法

2ふふふ:2014/10/08(水) 15:08:13
要約
RNAシークエンシング(RNA-seq)は個別遺伝子の発現レベルに関してのみならず、その細胞の
ゲノム配列についての情報をも提供する。我々が全ゲノム一塩基多型(SNP)変異体情報のある
メッセンジャーRNAデータを使用する場合、対立遺伝子頻度は細胞集団の遺伝子組成、
および/または、染色体異常を示し得る。ここに私はどのようにしてmRNAの中のSNPが
最近取り下げられた刺激惹起性多能性獲得(STAP)細胞論文に基づいたRNA-seqデータに
焦点を当てることによって、RNA-seqの実験を評価するために使用し得るかという方法を示します。
分析は異なった種類の細胞と染色体異常が誤ってデータセットに含まれているかもしれないことを
示ました。この再評価は、対立遺伝子頻度の観察が研究中や実験の質の遡及評価をともなう
サンプルの品質評価に役立つかもしれないことを示しています。

3ふふふ:2014/10/08(水) 15:09:03
導入
分子生物学的実験では外部ソースや環境物質或いは共培養フィーダー細胞などの望ましくない細胞からの
汚染を防ぐように常に注意が払われなければならない。このことは、単一細胞のレベルでのメッセンジャー
RNA解析がより一般的となっている現在、ますます重要になっています。シークエンシング実験をせずに
汚染を検出するのはしばしば非常に困難であり、また研究者が汚染を疑うのは結果が予期された発見と
著しく異なった場合のみである。さまざまな品質管理手法が提案されているが、彼らは(Wang et al. 2012)
実験の他の技術的な側面に主に焦点を当てている。ここでは私は次世代シーケンサー(NGS)を用いた
研究において、とりわけRNA-seq技術に基づいたメッセンジャーRNA分析において、汚染細胞を検出する
ためのアプローチについて説明します。

4ふふふ:2014/10/09(木) 18:15:55
要約
RNAシークエンシング(RNA-seq)は個別遺伝子の発現レベルに関してのみならず、その細胞の
ゲノム配列についての情報をも提供する。我々が全ゲノム一塩基多型(SNP)変異体情報のある
メッセンジャーRNAデータを使用する場合、対立遺伝子頻度は細胞集団の遺伝子組成、
および/または、染色体異常を示し得る。ここに私はどのようにしてmRNAの中のSNPが
最近取り下げられた刺激惹起性多能性獲得(STAP)細胞論文に基づいたRNA-seqデータに
焦点を当てることによって、RNA-seqの実験を評価するために使用し得るかという方法を示します。
分析は異なった種類の細胞と染色体異常が誤ってデータセットに含まれているかもしれないことを
示ました。この再評価は、対立遺伝子頻度の観察が研究中や実験の質の遡及評価をともなう
サンプルの品質評価に役立つかもしれないことを示しています。

5ふふふ:2014/10/09(木) 18:16:29
導入
分子生物学的実験では外部ソースや環境物質或いは共培養フィーダー細胞などの望ましくない細胞からの
汚染を防ぐように常に注意が払われなければならない。このことは、単一細胞のレベルでのメッセンジャー
RNA解析がより一般的となっている現在、ますます重要になっています。シークエンシング実験をせずに
汚染を検出するのはしばしば非常に困難であり、また研究者が汚染を疑うのは結果が予期された発見と
著しく異なった場合のみである。さまざまな品質管理手法が提案されているが、彼らは(Wang et al. 2012)
実験の他の技術的な側面に主に焦点を当てている。ここでは私は次世代シーケンサー(NGS)を用いた
研究において、とりわけRNA-seq技術に基づいたメッセンジャーRNA分析において、汚染細胞を検出する
ためのアプローチについて説明します。

6名無しさん:2014/11/13(木) 17:17:06
続きないの?

7名無しさん:2014/11/15(土) 12:49:03
必要なくなりそう。

8名無しさん:2014/11/17(月) 12:07:00
品質制御 −> 品質管理

9名無しさん:2014/11/17(月) 16:20:05
>8

全文頼む。

10名無しさん:2014/11/23(日) 08:44:36
なんで4,5と反転重複してるの?

11名無しさん:2014/11/23(日) 08:46:37
>8

品質管理なの?なんか製造業のQC活動見たいね。

それより全文頼むよ。

12名無しさん:2014/11/23(日) 08:47:14
>>10

誰かのいたずら。

13名無しさん:2014/11/23(日) 08:47:57
ふふふって何よ?

14名無しさん:2014/11/23(日) 08:48:49
亡くなった人のハンドルネームさ。

15名無しさん:2014/11/23(日) 10:18:52
亡くなった人は続き書かないでしょ。
誰か跡継ぎ居ないの?

16名無しさん:2014/11/23(日) 10:23:16
セント・パウロふふふ二世という人がふふふさんの衣鉢を継いだといわれていたが
品性が粗暴ということでスレ主から追われて、下界に降臨なさったといわれているので
ここにはもういない。

17名無しさん:2014/11/23(日) 10:24:45
誰か続き書いてくれネエかな。

>8 なんかどう?

188:2014/11/23(日) 10:25:23
俺は忙しい。

198:2014/11/23(日) 10:26:45
遠藤論文って小保方実験ねつ造の決定的証拠と評判なんでしょ?

20名無しさん:2014/11/23(日) 10:28:11
こんな時間に書き込んでるのに忙しいって、誰も真に受けない。

21名無しさん:2014/11/23(日) 10:29:51
遠藤は論文の細胞とNCBIに提出された細胞と違ってると言ってるだけ。

22名無しさん:2014/11/23(日) 10:31:48
普通は違わないんで、違うというのは普通じゃない。従って
実験ねつ造じゃないのと推論するんでしょ。

23名無しさん:2014/11/23(日) 10:32:50
そこに小保方未熟粗忽説があるから紛らわしいのよ。

24名無しさん:2014/11/23(日) 10:34:24
遠藤論文は正しくないかも知れないという説もあるんでしょ。
だれも専門家が教えてくれないね。

25名無しさん:2014/11/23(日) 10:36:29
ただ、東大の第三者機関も同じデータから同じ手法で確認したと言ってる。
無論、第三者と言えるかどうかははっきりしない。ただ、遠さんの友人では
無いかとも言われている。若山さんのときもそうだった。

26名無しさん:2014/11/23(日) 10:40:30
同じ手法でやったら同じ結論だったというのは確認されていると言って
いいんじゃないかな。ただ、同じ手法だから、そもそもの手法適用判断が
間違っていたら同じように間違えたというに過ぎないかもしれない。
実際にコンタミ細胞を自分達で作ってデータを取り、その手法の適用が
正しいかどうかの検証は第三者追試されてないばかりか、本人がそもそもしてない。
ここも小保方の実験とたいして変わらない実証の弱さよね。

27名無しさん:2014/11/23(日) 10:41:49
遠藤さんは細胞をコンタミさせてみるなんて仕事はしてないから
それは難しかったんだろうね。そもそも仕事が違うからな。

28名無しさん:2014/11/23(日) 13:37:52
インフォの方で、この手法について語られる人がいない。

29名無しさん:2014/11/23(日) 14:45:15
>>25
科学的な価値から言えば、友人でも誰でも、本人以外は「第三者」だよ。

30名無しさん:2014/11/23(日) 15:38:19
ん?

31名無しさん:2014/11/23(日) 15:56:37
科学はシンパシーとは別に存在するから。

32名無しさん:2014/11/23(日) 16:01:01
一般的意味に置いてでしょ。そういう時は科学的価値からなんて言わないのよ。
組織が了解してやってる検証じゃないといううことで、一体誰の予算使ってたの
という問題になってるのを知らないのね。

33名無しさん:2014/11/24(月) 00:29:27
>>26
>>実際にコンタミ細胞を自分達で作ってデータを取り、その手法の適用が正しいかどうかの検証は第三者追試されてないばかりか、本人がそもそもしてない。
>>ここも小保方の実験とたいして変わらない実証の弱さよね。

遠藤のは単なるデータ解析だから、コンタミしている疑似データを作る事は可能。
しかし、実際にコンタミ細胞を自分で作ったところで、小保方の使った細胞を手に入れない限り、再現はできない事は誰でも解っている。
それをあえてやっていて、本人等へ否定してみろと言う事を暗に含め、本人等がこのデータが本当に何であるのかの情報開示をしないことを批難しているのですよ。

34名無しさん:2014/11/24(月) 00:32:43
>>32
>>組織が了解してやってる検証じゃないといううことで、一体誰の予算使ってたのという問題になってるのを知らないのね。

内部告発と言われることも考えて、最初の解析はすべて自前で揃えてやったとブログで語っている。
実名を公開した後は、理研から認められて行っているので、問題無かろう。

35名無しさん:2014/11/24(月) 08:11:56
>>33

なんでこんなバカがここに来てるんだ?

「遠藤のは単なるデータ解析だから、」と
「コンタミしている疑似データを作る事は可能。」は因果がないじゃないか?
NCBIデータというのは単なるデジタルデータだぞ。それを遠藤が
自分のパソコンで市販のソフトを使って分析したんじゃないか。
自分でコンタミ細胞を作って、自分で解析部署に出して、そのデジタルデータを
使えば間違いない解析手法途謂うことを確認できるじゃないかいう趣旨でしょ。
遠藤は細胞屋じゃ無いんだからそこまで人に頼んで作ってもらうのは
大変だからやらなかったんだろうといってるのに、お前は細胞屋じゃないから
可能と書いてるんだぞ。

どこから来たバカなんだ。

誰でも分かってるようなことをもっともらしく書いてるが
ここは遠藤論文がテーマだぞ。スレ違いだろ。

36名無しさん:2014/11/24(月) 08:18:17
>>34

東大と内部告発と関係ないだろ。何を言ってるんだ。
第三者機関に頼んでやってもらったというときには
第三者機関が正式に追試を承知してやってるという意味になるが、
実際にはそこに勤めている友人が、その機関から配分を受けている
自分の予算の中で組織の正式な了解も無くやってるということが
あったから問題になってるんだが、それ以前にお前が噛み付いてきてる
ところが全体の問題提起からまったくずれてるのさ。

個々はお前の来るところじゃない。

37名無しさん:2014/11/24(月) 16:07:07
>>33
Figure 1(C) Allele frequency of HSC samples contaminated with different percentages of ESCs as shown

論文中でシミュレーションは、一応やっている。 ただし HSC(B6)にESC(129B6)をコンタミさせている。

TS(CD1)で、やってほしいな。

38名無しさん:2014/11/24(月) 16:28:49
>>37

公開データベースから得られた様々な細胞型から
RNA-seqのデータのいくつかのセットの対立遺伝子頻度を調べた結果だと書いてあるでしょ。

スレ主は、そんなシミュレーションでなく、実際にコンタミ細胞を作って資料を取って比較しなさいと
言ってるんでしょ。

39名無しさん:2014/11/24(月) 23:23:22
>>38
まずは、出ている論文を精査してみるのが本筋だと思う。

40名無しさん:2014/11/25(火) 01:27:28
>>35
>>誰でも分かってるようなことをもっともらしく書いてるがここは遠藤論文がテーマだぞ。スレ違いだろ。

いや、お前が理解できてないだけね。

41名無しさん:2014/11/25(火) 01:35:09
>>36

内部告発の件は、遠藤の理研の予算は、STAP細胞の分析のための予算では無いので、内部告発のために別研究の予算を流用したと指摘されないように行ったと言っているものだ。
また、第三者がどこの予算を使おうが、解析結果が変わるわけでは無かろう。

42名無しさん:2014/11/25(火) 06:41:32
下げといてって言ってるだろ。意味わかんないの。

43名無しさん:2014/11/25(火) 06:42:47
>>39

「8番染色体上にトリソミー」の問題意識に追いついたかい?

44名無しさん:2014/11/25(火) 06:44:18
初代ふふふさんが石以て追われなさったのは返す返すも残念だったねえ。

45名無しさん:2014/11/25(火) 06:49:00
そっと始めて18番辺りから正体現したんだったネエ。
素人なのに遠藤論文が正しければ小保方はねつ造している、
小保方がねつ造していなければ遠藤論文は間違っているとまで極言して、
問題意識を喚起しようとなさったのに、紆余曲折を経て、とうとう
ゴルゴダの丘の上で憤死なさって、ほんとにどんだけ無念だったか
知れやしない。

46名無しさん:2014/11/25(火) 06:51:32
同じことはYasuさんも感じたみたいだね。一時期小保方応援の気持ちが
萎えてた時期がある。後に小保方の粗忽に全てを負わせて、ミス説に戻った。
でも、ふふふさんはその粗忽説にあんまりだと疑念を呈した。

47名無しさん:2014/11/25(火) 06:55:27
セント・パウロ・ふふふ二世もいい人だったけどな、ちょっと悪ふざけを
自省なさって、今や下界に降臨しなさって、償いをなさっているらしい。
仮の名を阿部信三と名乗られているらしい。

48名無しさん:2014/11/25(火) 06:56:49
お前のはらしいとか、思うばっかりだな。
ふふふ三世は出てこないの?

49名無しさん:2014/11/25(火) 06:58:33
私は8番さんにお願いしてるけどな。
まだ返事が来ない。というより、忙しいと断られた。

508:2014/11/25(火) 07:00:11
忙しいと言っただけで断ってはいない。

51名無しさん:2014/11/25(火) 07:01:29
あっ、そうなの。じゃ次からはセント・パンテレイモン・ふふふ三世で
登場してね。

52セント・パンテレイモン・ふふふ三世:2014/11/25(火) 07:03:28
なんだいギリシァ正教みたいな名前だな。
まあ、いいや。
じゃ最初からやり直しだ。
とりあえず半分やっつけてから議論だ。

53セント・パンテレイモン・ふふふ三世:2014/11/25(火) 07:04:08
『一塩基多型対立遺伝子頻度を用いたRNA-seqのための品質制御方法』

Takaho A. Endo*

Article first published online: 21 SEP 2014

ページ先頭
要約
導入
結果と検討
結論
実験経過
謝辞
照会
参考

54セント・パンテレイモン・ふふふ三世:2014/11/25(火) 07:05:02
<要約>

RNAシークエンシング(RNA-seq)は個別遺伝子の発現レベルに関してのみならず、その細胞のゲノム配列についての情報をも提供する。我々が全ゲノム一塩基多型(SNP)変異体情報のあるメッセンジャーRNAデータを使用する場合、対立遺伝子頻度は細胞集団の遺伝子組成、および/または、染色体異常を示し得る。ここに私はどのようにしてmRNAの中のSNPが最近取り下げられた刺激惹起性多能性獲得(STAP)細胞論文に基づいたRNA-seqデータに焦点を当てることによって、RNA-seqの実験を評価するために使用し得るかという方法を示します。分析は異なった種類の細胞と染色体異常が誤ってデータセットに含まれているかもしれないことを示ました。この再評価は、対立遺伝子頻度の観察が研究中や実験の質の遡及評価をともなうサンプルの品質評価に役立つかもしれないことを示しています。

55セント・パンテレイモン・ふふふ三世:2014/11/25(火) 07:07:27
<導入>

分子生物学的実験では外部ソースや環境物質或いは共培養フィーダー細胞などの望ましくない細胞からの汚染を防ぐように常に注意が払われなければならない。このことは、単一細胞のレベルでのメッセンジャーRNA解析がより一般的となっている現在、ますます重要になっています。シークエンシング実験をせずに汚染を検出するのはしばしば非常に困難であり、また研究者が汚染を疑うのは結果が予期された発見と著しく異なった場合のみである。さまざまな品質管理手法が提案されているが、彼らは(Wang et&nbsp;al. 2012)実験の他の技術的な側面に主に焦点を当てている。ここでは私は次世代シーケンサー(NGS)を用いた研究において、とりわけRNA-seq技術に基づいたメッセンジャーRNA分析において、汚染細胞を検出するためのアプローチについて説明します。

56セント・パンテレイモン・ふふふ三世:2014/11/25(火) 07:08:05
RNA-seqの実験においては、NGS由来のmRNA配列が標的ゲノムと比較される。そして、すべての遺伝子の整列させられた読み取り断片が集められる。またそのためにすべての遺伝子はエクソンの位置がデータベースに提供されている。DNAマイクロアレイ技術の中で、RNA-seqの利点の一つはゲノム配列に関するいくばくかの情報をも同時に提供することである。

57セント・パンテレイモン・ふふふ三世:2014/11/25(火) 07:08:52
mRNAが二つの常染色体に由来することと、それゆえ、二つ(またはそれ以上)の対立遺伝子がNGSデータの中のいくつかの系譜断片に観察されるかもしれないことは期待される。対立遺伝子頻度のゆがみは、観測されたのSNPによって評価されるように、いくつかの可能な生物学的現象を指示し得る。ゆがんだ分布の最も好ましい原因は、生物学的関係の条件下で、ゲノムインプリンティング、突然変異などの対立遺伝子の特異的発現が有った場合である。しかしながら、混入細胞が本物の標的細胞とは異なるゲノム背景を持っている場合には、歪んだ対立遺伝子頻度のもうひとつの可能な原因としてサンプルの汚染がある。

58セント・パンテレイモン・ふふふ三世:2014/11/25(火) 07:09:30
対立遺伝子頻度は各対立遺伝子のPCR効率に依存しているけれども、またこの分析では分布の分散が特にPCR条件に依存していたが、細胞型とは独立して、平均はヘテロ接合のSNPの約50%であった。

59セント・パンテレイモン・ふふふ三世:2014/11/25(火) 07:10:08
RNA-seqの中の対立遺伝子頻度はインプリント遺伝子を検出するために使用されてきている(DeVeale et&nbsp;al. 2012; Lagarrigue et&nbsp;al. 2013)。ここで説明するアプローチはヘテロ接合のSNPを用いたRNA-seqの研究の中で、汚染細胞汚検出のためのバリエーションデータベースの適用を拡張します。さらに、このアプローチは、染色体異常を検出する方法をも提供します。特定の染色体におけるゆがんだ対立遺伝子頻度は異数性によって引き起こされ得ます。異数性は多様なタイプの異常を引き起こしうるので、異数性が標的組織に期待されていない場合、我々は研究における異常細胞からのデータを除外することができる。

60セント・パンテレイモン・ふふふ三世:2014/11/25(火) 07:10:51
この方法は遡及的に実験品質を評価するために適用可能であると同時に、明らかに再現性がない結果を解釈するのに便利です。

61セント・パンテレイモン・ふふふ三世:2014/11/25(火) 07:12:04
<結果と検討>

***数理モデルとシミュレーション

二倍体細胞は相同染色体のペアを持っています。遺伝子は、インプリント遺伝子の場合と性染色体上の遺伝子を除き、父方と母方の染色体からおよそ同一の頻度で提供されている(DeVeale et&nbsp;al. 2012; Lagarrigue et&nbsp;al. 2013)。片親からの配列の発現頻度は、二項分布に従う見込みによって期待されている。 PCR増幅に起因するバイアスがこの分布に影響を与える可能性があるため、PCRバイアスの影響を調べた。ヘテロ接合のSNPを有するノンインプリンティング遺伝子を考える際、対立遺伝子頻度は、ひとつの細胞型で構成されたサンプルの約50%であると予測され、かつ汚染によって引き起こされた特定のSNPのアンバランスな表現は分布ピークのシフトとして表われてくるはずです。

62セント・パンテレイモン・ふふふ三世:2014/11/25(火) 07:12:39
混入細胞が対立遺伝子頻度の単純な二項分布にどのように影響するかを図示するためにシミュレーションが実施された。参照対立遺伝子(A)の数をnA、代替対立遺伝子(a)のそれをnaとするとき、参照対立遺伝子の検出の可能性はnA /(nA+ na)である。 RNA-seqの実験では、PCRから生じるバイアスを考慮しなければならない。モデルを単純化するために、PCRバイアスはA及びaを含む配列がそれぞれ、2のα乗と2のβ乗倍に増幅されたと仮定して組み込まれた。もし我々がRNA-seqの持つ遺伝子座のN断片を得た場合は、k個の参照対立遺伝子配列の確率は次のように計算される。

63セント・パンテレイモン・ふふふ三世:2014/11/25(火) 07:15:36
くそっ、算式が貼り付けられない。表示方法も分からない。
原論文で確認して。

算式1(省略)

仮にPを以下のように置く。

算式2(省略)

64セント・パンテレイモン・ふふふ三世:2014/11/25(火) 07:16:16
図1AのシミュレーションはN= 50で、かつ標準偏差が0(無PCRバイアス)または1(PCRバイアス)を有する ガウス分布に従ったβ−α条件を用いて行った。シミュレーションは分布の分散がPCRバイアスに依存的であったこと、分布様式が対立遺伝子の組成に対応していることを示した。公開データベースから得られた様々な細胞型からRNA-seqのデータのいくつかのセットの対立遺伝子頻度を調べた結果、シミュレーション(図1B)と一致した。 0%と100%でのピークは観察された細胞内のホモ接合のSNPに起因する可能性があります。人工汚染状況はまた2つのセルのカテゴリからのRNA-seqのデータセットのランダムサンプリングによって作られています。それは純粋なC57BL / 6(B6)の造血幹細胞(HSC)と各種129及びB6胚性幹細胞(129B6F1のESC)の各種比率の混合物の二つです。数学的シミュレーション(図1C、灰色の線)のように曲線形状とピーク位置はその比率に沿って変化しています。

65セント・パンテレイモン・ふふふ三世:2014/11/25(火) 07:17:46
フィギャー1も貼り付けられない。
原論文で確認して。

図1(省略)

66セント・パンテレイモン・ふふふ三世:2014/11/25(火) 07:18:32
[図1] RNA-seqデータの対立遺伝子頻度解析。(A)修正された二項分布を用いたSNPの対立遺伝子頻度のシミュレーション。ピーク位置は、2つの対立遺伝子組成物により決定され、分布の分散はsd、即ちシミュレートされたPCRバイアスの標準偏差に依存している。(B)いくつかの細胞型におけるSNP分布。ESCs<ES細胞>(赤、SRR1047502、129B6F1背景) 、線維芽細胞から誘導されたiPSs<iPS細胞>(黄色、SRR1047504、129B6F1)、MEF<マウス胎児線維芽細胞:フィーダー細胞>(青、SRR104220、129B6F1)、正常な線維芽細胞(NFs;緑、SRR1191170、B6 X BALB/ c )、癌化した線維芽細胞(CAFs;紫、SRR1191171、B6 x BALB / c)及びHSCs<造血幹細胞>(灰色、SRR892995、B6)。各細胞型のために適用されたSNPの数は各ボックス内の括弧内に示されている。 (C)示されたES細胞の異なる割合で汚染された造血幹細胞資料の対立遺伝子頻度。

67名無しさん:2014/11/25(火) 07:23:58
>>39

訳してる人はふふふ3世なので、代々素人だから、当然何が書かれているのか
全く理解して無い。ここまでのところ添削と解説と精査お願いします。

次回は{***STAP論文の再解析: 線維芽細胞増殖因子によって誘導される幹細胞(FI-SC)の遺伝子型解析}

から続きます。それまでよろしく。

68名無しさん:2014/11/25(火) 07:36:25
60のところ遠藤さんの論文の目的は二股かけてるよね。

69名無しさん:2014/11/25(火) 07:37:36
ちゃんとさげろよ。

70名無しさん:2014/11/27(木) 09:31:35
***STAP論文の再解析: 線維芽細胞増殖因子によって誘導される幹細胞(FI-SC<FI幹細胞>)の遺伝子型解析

71セント・パンテレイモン・ふふふ三世:2014/11/27(木) 09:33:03
***STAP論文の再解析: 線維芽細胞増殖因子によって誘導される幹細胞(FI-SC<FI幹細胞>)の遺伝子型解析

この研究はRNA-seqデータの中のSNP対立遺伝子頻度がいかにしてデータセットのプロパティを表示しうるに至るのかを検討している。 小保方らは最近STAP現象を報告した。それは胚盤胞に注入された場合に胚および胎盤組織を作り出すことができる多能性幹細胞へと変化した体細胞の誘導細胞再プログラミングを意味する(Obokata et&nbsp;al. 2014a,b)。上述の対立遺伝子頻度のアプローチは研究者らによって提供されているNGSデータセットを調べてきたものである。参照対立遺伝子(dbSNPのB6遺伝子型に相当)と、代替の対立遺伝子(この研究では129の遺伝子型に対応する)間の対立遺伝子頻度は、TruSeq試薬を使用して得られた7回の反復実験から得られたRNA-seqデータの中で検討されている(サポート情報の図2AおよびS1) 。

72セント・パンテレイモン・ふふふ三世:2014/11/27(木) 09:33:37
7回の実験中6回の対立遺伝子分布は図 1Aで期待されている親の染色体と同じ表現を示した。ES細胞、STAP細胞、およびSTAP幹細胞(STAP-SCS)を含む実験では全くの0%のピークは無かったが(サポート情報の図S1)、おそらく細胞が実験室で戻し交配されたため、公開データベース (J. Sharif and K. Isono, personal communication)のものとは異なる遺伝子型のマウスから得られたからであろう。

73セント・パンテレイモン・ふふふ三世:2014/11/27(木) 09:34:50
図2(省略)

原論文で確認して。

74セント・パンテレイモン・ふふふ三世:2014/11/27(木) 09:35:34
[図2] 汚染を示すFI幹細胞のmRNAで検出されたSNP。 (A)STAP論文に使用されたES幹細胞とFI幹細胞のRNA-seqの実験から得られた対立遺伝子分布。ES幹細胞(青)とFI幹細胞(赤)の両方とも129B6F1遺伝子背景を有していると注釈されている。各実験のために適用されたSNPの数は、ボックス内の括弧で示されている。(B)ES幹細胞で高頻度で発現されるSall4及びKlf4で検出されたSNP。 B6型対立遺伝子は青で、129型対立遺伝子(すなわち、非B6)は黄色で示されている。 (C)TS細胞特異遺伝子Elf5及びSox21で検出されたSNP。 (D)元の論文で使用された幹細胞で観察された沢山のホモ接合/ヘテロ接合SNP。 FI肝細胞の中で観察された組成物だけが遺伝子発現に影響を与えると予測される。 P値はTS細胞特異遺伝子およびES細胞特異遺伝子間の遺伝子型分布のフィッシャーの正確確率検定を用いて計算されている。 REP1およびREP2は、2つの反復実験を表す。(E)代表的なサイトカインおよび高頻度で胎児線維芽細胞に発現る細胞外マトリックス遺伝子のヒートマップ。全サンプルの中央値に対する万単位読み取り断片あたりの千単位エクソン断片の正規ログ比(FPKM)が示されている。

75セント・パンテレイモン・ふふふ三世:2014/11/27(木) 09:36:15
驚くべきことにF1 129SV(129)とB6の細胞集団由来と注釈されているFI幹細胞はバイアスのないノンインプリンティング遺伝子の対立遺伝子分布パターンを示さなかった(サポート情報の図S1)。分布は不均等な染色体を有する細胞のものにより類似している。これらのFI肝細胞はFGF4<線維芽細胞増殖因子-4 >によったSTAP細胞から誘導され、かつそれらの遺伝子発現の特徴と胎盤に貢献する能力のように、栄養膜細胞(TS細胞)に似た特性を有することが報告されている(Obokata et&nbsp;al. 2014a)。

76セント・パンテレイモン・ふふふ三世:2014/11/27(木) 09:36:45
大多数のSNPがB6と似ているという事実と組み合わせると、129B6F1遺伝子型とFI幹細胞曲線の明らかな差異はFI幹細胞がほぼ純粋なB6バックグラウンドの新生仔マウスに由来することを示唆している。遺伝子発現パターンの更なる分析は、B6型対立遺伝子と非B6間のSNPの不均一性が遺伝子発現特性に起因することが示唆されている。図2Bに示めされているように、129(すなわち、非B6)およびB6間で異質であることが期待されているSNPは、いくつかのES細胞マーカー遺伝子の中で調べられている。ES細胞はこの遺伝子座において129とB6の両方のバックグラウンドからの対立遺伝子を持ち込んでいるが、FI幹細胞は、ES細胞と同じ遺伝子背景を持つと書かれているにもかかわらず(Obokata et&nbsp;al. 2014a)、B6からの対立遺伝子しか持ち込んでいない。 B6遺伝子のこの優勢はTS細胞のマーカー遺伝子には観察されなかった(図2C)。

77セント・パンテレイモン・ふふふ三世:2014/11/27(木) 09:37:17
FI幹細胞の特異性は図2B及びCに示す遺伝子に限定されなかった。すべての異質SNPが、ES細胞に特異的遺伝子のSNP、TS細胞に特異的遺伝子のSNP、および他の遺伝子のSNPの3つのグループに分類されているとき、FI幹細胞のみがこれらのグループに広くヘテロ接合のSNPを有していた(図2D)。試料中に含まれるセルのすべが同じ細胞の特徴を共有している場合、異なる遺伝子型を有する特定の遺伝子セットのこの現象は見られ得ないであろう。

78セント・パンテレイモン・ふふふ三世:2014/11/27(木) 09:37:57
FI幹細胞はいくつかのTS細胞マーカーで特定の遺伝子型を示したので、それらはのTS細胞で混入汚染されている可能性がある。しかしながら、 FI幹細胞がその遺伝子型が元の論文に記載されていないマウス胚性線維芽(MEF)フィーダー細胞とともに培養されていたとしたら、フィーダー細胞も混入汚染の他の原因でありうる。この研究にとって、MEF<マウス胚性線維芽細胞>のためのマーカー遺伝子の発現は調べられており、かつ、ES細胞とTS細胞のマーカー発現と比較されていて、その結果はFI幹細胞の中のこれらのMEF遺伝子の発現の欠如を示している(図2E)。 従ってMEF<胚性線維芽細胞>の混入の可能性は無視でき、かつ、重複RNA-seqの実験で検出された対立遺伝子頻度の傾斜分布の最も可能性の高い説明は、FI幹細胞の集団が次の2つの細胞型に由来していることである:B6遺伝子背景を有するES様細胞と、B6と129以外のマウス株で、CD1と同様の遺伝子型を有するTS様細胞。

79セント・パンテレイモン・ふふふ三世:2014/11/27(木) 09:38:30
***撤回された論文の再分析:染色体異常の検出

SNPの分布分析は異数性を検出するためにも適用することができる。各染色体についての対立遺伝子頻度を調べる際には、対の染色体が同数の複写をもたないときに、異常な染色体が歪んだ分布を持つのだと推定される。図3Aに示すように、染色体分析は最初の研究で使われたSTAP細胞における8番染色体の異常を示している。細胞が異なる株の親からの2つの染色体を持っている場合には、我々はピーク対立遺伝子頻度が約50%に起こることを期待することができ.る。 STAP細胞のピークの対立遺伝子頻度は、しかし、約33%であった。それは2つの染色体の一つが染色体8の3つのコピーをもたらすように複製されたように見える。

80セント・パンテレイモン・ふふふ三世:2014/11/27(木) 09:39:02
実験で使用されたSTAP細胞は129とB6細胞由来である。重複染色体は129の親からのものであると推定される。なぜならそれが唯一の非B6のSNP対立遺伝子を含んでいたためである。トリソミー8がマウスES細胞の中での最も一般的な染色体異常であることは注目に値する。それは97回の細胞株を調べたうちの31回この異常をもつと報告されていることである(Maysharら、2010)。トリソミー8を持つES細胞は生育が優性であるが、キメラは生殖系列への変異を引き起こさず(Ben-David et&nbsp;al. 2013)、マウス内のトリソミー8は12日目または13日目での出生前死亡をもたらします (Kim et&nbsp;al. 2013)。

81セント・パンテレイモン・ふふふ三世:2014/11/27(木) 09:39:43
図3(省略)

原論文で確認して。

82セント・パンテレイモン・ふふふ三世:2014/11/27(木) 09:40:16
[図3] RNA-seqデータのSNP解析によって検出されたトリソミー。 (A)全染色体と8番染色体の対立遺伝子頻度分布。STAP細胞の8番染色体のみが約50%を中心としないピークを持っていた。それは129株起源の8番染色体が染色体のトリソミー生成するように複製されたことを示す。図1及び図2で分析されたRNA-seqデータとは異なり、この図において分析されているRNA-seqデータはSMARTer試薬キットを使用して作られている。(B)染色体ごとの発現解析。 8番染色体上の遺伝子のみが有意に多く発現しし、13番染色体上の遺伝子が有意に低い発現している。 P値は二群スチューデントt検定を用いて計算されている。

83セント・パンテレイモン・ふふふ三世:2014/11/27(木) 09:40:47
メッセンジャーRNA解析を用いた異数性検出が報告されているので(Gropp 1982; Liu et&nbsp;al. 1997)、各染色体上の遺伝子発現を本研究で分析した。 8番染色体と13番染色体上の遺伝子はSTAP細胞とES細胞の間で有意に異なった発現パターンを持っていた。第8染色体遺伝子発現はES細胞よりSTAP細胞において1.3倍高かった(P-value&nbsp;=&nbsp;2.89&nbsp;×&nbsp;10−25; 図3B)。この結果はSNP解析によって検出された8番染色体のトリソミーと一致している。ここで使用されているSNP対立遺伝子頻度法は、したがって、我々が細胞のSNPの遺伝子型を知っていて、かつ、対照細胞が正常な核型を持っている場合には異数性を検出するために使える。

84セント・パンテレイモン・ふふふ三世:2014/11/27(木) 10:57:55
***SNP対立遺伝子頻度の有効性

SNP対立遺伝子頻度手法はRNA-seqデータを作成しようとするときに通常使用されるサンプル中の汚染細胞を検出するが、この手法の感度は配列リードの長さに依存する。ここで限られた数のRNA-seqデータセットを仮定すると、利用可能なSNPの数がおよそ千よりも少ない場合は、グラフは分配の違いを検出するにはあまりに雑音が多くなる。例えば、5948個のSNPを持つMEF<マウス胎児線維芽細胞>は23838個のSNPを持つES細胞のデータよりもスパイクのより顕著な量を生成する。各染色体に割り当てられたSNPはまた、SNPの数が1000より小さいときの分布が非常にノイズが多くなりがちなことを示唆している(サポート情報の図S2)。二項分布の分散は試行回数に依存しているため、感度にとってはカバー率も重要である。それ故、平均カバー率がすべての遺伝子の20倍であることが要求されている場合、必要な読み出し回数は、MEF<マウス胎児線維芽細胞>の分布を導出するために使用された約1.1×109塩基のリード回数にほぼ対応するところの、約1.3×109ヌクレオチドであろう(図1B)。

85セント・パンテレイモン・ふふふ三世:2014/11/27(木) 10:58:29
図1Bはまた人工多能性幹細胞(iPS)のゲノム安定性のいくつかの興味深い側面を示している。 129B6F1から生成されたiPS細胞はB6型対立遺伝子のよりホモ接合したSNPを有していた。先に述べたように、これは細胞の汚染の結果であるかもしれないし、この二つの実験で使用された細胞の性質の違いの結果である可能性もあるが、実験プロセスが遺伝子型の転移を誘導したという魅力的な可能性もある。 iPS細胞工学がゲノム的な、および/または、ゲノム外環境的な不安定性を誘導すると報告されているように (Hussein et&nbsp;al. 2011; Chang et&nbsp;al. 2014)、今後の研究においてiPS細胞の対立遺伝子頻度を調べることが重要となるでしょう。

86セント・パンテレイモン・ふふふ三世:2014/11/27(木) 10:59:01
RNA-seqや他のNGS実験で検出されたSNP頻度の違いは、おそらく核型を直接観察することによって検出されるものと比べると、正確ではありません。しかし、この研究で記載された方法は、試験細胞がもはや利用不可能である場合でも、遺伝子型か表現型のみによるよりもより信頼できる証拠を提供することが期待されている遺伝子型(SNP)と表現型(遺伝子発現)の両者から染色体異常を検出するために使用することができます。

87セント・パンテレイモン・ふふふ三世:2014/11/27(木) 10:59:50
この研究のSNP対立遺伝子頻度法の1つの利点は染色体複製の親の起源を検出しかつ決定する、その潜在能力にある。仮想染色体分析(Ben-David et&nbsp;al. 2013)を介したもうひとつの利点は、異数性のない対照細胞を必要としないことである。なぜなら、シミュレートされたモデルはそもそも二倍体細胞の対立遺伝子頻度がピークを約50%に持っているだろうと期待しているからである(図1A)。

88セント・パンテレイモン・ふふふ三世:2014/11/27(木) 11:00:25
***FI幹細胞サンプルの汚染

RNA-seq断片の対立遺伝子頻度の検討はサンプリングされた細胞の特性検出を可能にする。特定の細胞型において特殊に発現される一組の遺伝子が異なる遺伝子型を示す場合、その細胞の起源を想定することができる。メッセンジャーRNA配列におけるSNPに関するこの分析は、提示された小保方らの研究から、STAPとFI幹細胞サンプルの起源が最初に報告されたよりも異なっているらしいことを読み取る。シミュレーションは分布の様態がサンプルの細胞組成とPCRバイアスに起因する分散の両方に依存することを示している。二項分布のPCRバイアスを無視すると、我々は混入細胞の割合を大雑把に分布のピーク位置によって推定することができる。

89セント・パンテレイモン・ふふふ三世:2014/11/27(木) 11:01:01
最初の研究でFI肝細胞を汚染する最も可能性の高い細胞型であるTS細胞は、非B6同型接合対立遺伝子よりももっと多くのヘテロ接合(B6/非B6)対立遺伝子を有していた。 FI幹細胞のSNPは、B6および129が異なるヌクレオチドを有し、かつそれぞれ、6859と7243のヘテロ接合SNPおよび24と14の非B6ホモ接合性対立遺伝子に結果された重複実験をされた対立遺伝子の中で数えられた。混入細胞の割合は遺伝子型観察によって推定することができる。なぜなら総数のピークが約10%であることが期待されているのに対して、ピークの対立遺伝子頻度が約95から96パーセントであったためである。この結果はTS細胞のマーカー遺伝子の発現と一致している。調べられたTS細胞のマーカー遺伝子の全てが約10%のTS細胞(図4A)の中で発現している。

90セント・パンテレイモン・ふふふ三世:2014/11/27(木) 11:02:17
図4(省略)

原論文で確認して。

91セント・パンテレイモン・ふふふ三世:2014/11/27(木) 11:02:51
[図4] FI幹細胞に組み込まれたメッセンジャーRNAの検討。 (A)ES細胞、TS細胞及びFI幹細胞の中のTS細胞マーカー遺伝子の発現。実線は平均のTS細胞遺伝子発現を示し、破線は平均の10%を示している。 (B)B6と129が同じSNPを共有し、TS細胞はそうでない場合にDes、Grb2、Setd7、Fbxo21、およびChd4で検出されたヘテロ接合SNP。(C)TS細胞独自の対立遺伝子を有するヘテロ接合/ホモ接合のSNP分布のジーンワイズ分析。

92セント・パンテレイモン・ふふふ三世:2014/11/27(木) 11:03:28
B6と129由来の配列が同じヌクレオチドを持ち、かつFI幹細胞由来のものはそうでない場合のFI幹細胞独自のSNPが検討された。これらのSNPの大部分は実験で使われたTS細胞のCD1バックグラウンドと一致し、かつB6または129とは異なっていた、対応遺伝子ごとの表示(図4B)及び全SNP分析(図4C)はFI幹細胞がTS細胞独自のSNPを共有していることを示している。FI幹細胞の中に混入したTS細胞の割合が軽微だったので、TS細胞独自のSNPのほとんどがヘテロ接合として現れた。これらの結果は、RNA-seqデータが、ES細胞のような発現パターンを持つ約90%のB6細胞と、TS細胞のようなパターンを有する約10%のCD1のような細胞の、二つの主要な細胞集団からの転写物を含んでいるという見解を支持する。したがって、FI幹細胞が胎盤に貢献するという小保方ら論文の主張は臓器幹細胞であることが知られている(Tanaka et&nbsp;al. 1998)TS細胞の混入による間違いを根拠にしているかも知れない。

93名無しさん:2014/11/27(木) 11:04:07
***STAP現象の解釈

SNPを使った異数性検出はまた元の実験に汚染のあることを示唆している。遺伝子型と表現型の両方の解析はObokataらの実験で使用されたSTAP細胞が8番染色体にトリソミーを有することを暗示し、転写因子検査は13番染色体上に遺伝子の異型の発現があることを示している。トリソミー8はマウスにおいて最も一般的な染色体異常であり、第8番染色体は13番染色体の末端に融合することが報告されている (Kim et&nbsp;al. 2013)。これらの観察は図3(b)の仮想染色体分析の結果を説明しているかもしれない。図3で使用されたRNA-seqデータは、STAP細胞が増殖しなかった条件下で培養された、新生児マウス脾臓細胞に由来するとして注釈されている。純粋なトリソミー8を有するマウスは胎生致死であるため、この記述は、トリソミーを有する細胞の優位性とは一致しない。したがって、これは、細胞がES細胞のものと非常に類似した発現特性を保有する培養細胞であったという結論に導く。

94名無しさん:2014/11/27(木) 11:04:40
<結論>

ここで記述されたSNP対立遺伝子頻度法は汚染検査されている細胞が共通の遺伝的背景を共有している際には、対立遺伝子頻度が汚染を検出するのに十分なだけ異ならないかもしれないという事実によって制約されている。しかし、この方法は、原理的には、多型を含むどのRNA-seqのデータにも適用可能であり、また前向きであれ遡及的であれ両方の品質管理のために、特にES細胞やiPS細胞及びそれらの派生細胞などの培養細胞を用いた研究にとって、有用であろう。

95セント・パンテレイモン・ふふふ三世:2014/11/28(金) 11:38:55
<実験手順>

***データセット

マウスバリエーションデータはサンガーマウスゲノムプロジェクト (エイチティーティーピー略sanger.ac.uk/resources/mouse/genomes/)から入手された。またバージョン137 VCF-フォーマットデータセットはdbSNP (エイチティーティーピー略ncbi.nlm.nih.gov/SNP/)から検索された。

96セント・パンテレイモン・ふふふ三世:2014/11/28(金) 11:39:43
遺伝子および含まれているエキソンの位置はiGenomes(エイチティーティーピー略illumina.com/sequencing/sequencing_software/igenome.ilmn)から入手された。 エキソンの外側にあるSNPはこのiGenomesの注釈を使用して元のVCFファイルから除外されている。従って1016227のSNPはデータセット全体のために使用されている。

97セント・パンテレイモン・ふふふ三世:2014/11/28(金) 11:40:17
この研究で調べたオリジナルのRNA-seqの実験からの生配列データはNCBIのシーケンス・リード&middot;アーカイブ(SRA)からダウンロードされている。プロジェクトの受託番号はSRP038104である。B6マウス株から得られたマウスのゲノム配列 (version 38, mm10) はNCBI GenBankからダウンロードされ、(着色スペースFASTQファイル用に)ボウタイで造られ、または(FASTQファイル用に)bowtie2で作られたプログラムを使用してボウタイデータベースにエンコードされた。RNA-seq実験のアクセッション番号(すなわち、SRA ID)は表S1(サポート情報)に表示され、かつアーカイブシーケンスのデータ送付の漏れが無いかのチェックサムは論文の責任著者の一人である山梨大学の若山照彦教授に確認してもらっている。

98セント・パンテレイモン・ふふふ三世:2014/11/28(金) 11:42:15
***RNA-seq分析

SRAデータベースsra-形式ファイルはsratoolkit.2.3.4-2を使ってfastq形式に変換されている。 配列アライメントのためにBowtie2(バージョン2.1.0、エイチティーティーピー略bowtie-bio.sourceforge.net/bowtie2/index.shtml)とtophat2(エイチティーティーピー略tophat.cbcb.umd.edu)プログラムが適用されている。この研究はメッセンジャーRNAの構造を考慮していなかったので、すべての配列は、50 bpの読み取り断片に断片化され、2つのミスマッチを許容する “–no-coverage-search -G genes.gtf”パラメータを指定してトップハットまたはtophat2を使用して整列させた。トップハットプログラムは SOLiD colored space fastq filesを分析するためだけに使用された。遺伝子発現のレベルは、(バージョン2.1.1)のcufflinksを用いて算出されたfragments per kilobase of exon per million reads (FPKM) 値で評価されている。 C ++で書かれたプログラムはBAMファイルの中のSNP対立遺伝子を検出、列挙するために開発されています。プログラムは、公開リポジトリ(エイチティーティーピー略github.com/takaho/snpexp/)で入手可能なオープンソースソフトウェアです。百万カフスを値を読み込むごと

99セント・パンテレイモン・ふふふ三世:2014/11/28(金) 11:42:48
***SNPの識別およびヘテロ接合性のテスト

マウスゲノム上に整列した配列断片は、SNP検出および上記の計数プログラムを使って分析されている。かつ20以上のカバー率のSNPだけが残されている。 95%以上のSNPシーケンスが二本鎖上で同じだった場合、対立遺伝子はホモ接合と定義される。

100セント・パンテレイモン・ふふふ三世:2014/11/28(金) 11:43:21
B6と129との間の全ゲノムのヘテロ接合は、B6と129 との異なる対立遺伝子による上述したSNPサブセットを使用して分析されている。SNPは既知の発現特性(TS細胞特異的、ES細胞特異的、またはその他)と遺伝子型(B6型ホモ接合、129型ホモ接合またはその他)によって分類されている。SNP分布は、モンテカルロマルコフ連鎖近似に関するフィッシャーの確率検証を用いて得られたP値によって調べられている。


新着レスの表示


名前: E-mail(省略可)

※書き込む際の注意事項はこちら

※画像アップローダーはこちら

(画像を表示できるのは「画像リンクのサムネイル表示」がオンの掲示板に限ります)

掲示板管理者へ連絡 無料レンタル掲示板