معلومة

4.2: حفظ التسلسلات الجينومية - علم الأحياء


العناصر الوظيفية في ذبابة الفاكهة

في ورقة عام 20071، ستارك وآخرون. تربط الخطوط الرمادية العناصر الوظيفية المتعامدة ، ومن الواضح أن مواقعها محفوظة بشكل عام عبر الأنواع المختلفة.

التعليمات

س: ما أهمية الحفاظ على موضع العناصر المتعامدة؟

ج: حقيقة الحفاظ على المواقف هو ما يسمح لنا بإجراء مقارنات بين الأنواع. خلاف ذلك ، لن نتمكن من محاذاة المناطق غير المشفرة بشكل موثوق.

تعتبر ذبابة الفاكهة من الأنواع الرائعة التي يجب دراستها لأن فصل ذباب الفاكهة في الواقع أكبر من فصل الثدييات. يقودنا هذا إلى ملاحظة جانبية مثيرة للاهتمام ، أي الأنواع التي يجب اختيارها عند النظر إلى توقيعات الحفظ. أنت لا تريد أن يكون لديك أنواع متشابهة جدًا (مثل البشر والشمبانزي ، والتي تشترك في 98٪ من الجينوم) ، لأنه سيكون من الصعب تمييز المناطق التي تختلف عن تلك التي هي نفسها. عند مقارنة الأنواع بالبشر ، فإن المستوى الصحيح من الحفظ الذي يجب النظر إليه هو الثدييات. على وجه التحديد ، يتم إجراء معظم الأبحاث في هذا المجال باستخدام 29 من الثدييات eutherian (ثدييات مشيمية ، بدون جرابيات أو أحاديات) للدراسة. من الأشياء الأخرى التي يجب مراعاتها الاختلافات في طول الفرع بين نوعين. سيكون موضوع دراستك المثالي عبارة عن عدد قليل من الأنواع وثيقة الصلة (قصيرة الطول) ، لتجنب مشاكل التفسير التي تنشأ مع طفرات طويلة في طول الفروع ، مثل الطفرات الخلفية.

معدلات وأنماط الاختيار

الآن بعد أن أثبتنا أن هناك بنية لتطور التسلسلات الجينية ، يمكننا البدء في تحليل ميزات معينة للحفظ. في هذا القسم ، دعونا ننظر في البيانات الجينومية على مستوى النيوكليوتيدات الفردية. سنرى لاحقًا في هذا الفصل أنه يمكننا أيضًا تحليل تسلسل الأحماض الأمينية.

قد نقدر شدة قيد الاختيار ω عن طريق عمل نموذج احتمالات لمعدل الاستبدال المستنتج من بيانات محاذاة الجينوم. يمكن أن يزودنا استخدام تقدير الاحتمالية القصوى (ML) لـ بمعدل الاختيار ω بالإضافة إلى سجل درجات الاحتمالات بأن المعدل غير طبيعي.

إحدى الخصائص التي يمكن أن نأخذها في الاعتبار هي معدل استبدال النوكليوتيدات في الجينوم. يوضح الشكل 4.3 تسلسلين للنيوكليوتيدات من مجموعة من الثدييات. يخضع أحد التسلسلات لمعدلات تغيير عادية ، بينما يوضح الآخر معدلًا مخفضًا. ومن ثم قد نفترض أن التسلسل الأخير يخضع لمستوى أكبر من القيود التطورية ، وقد يمثل قسمًا أكثر أهمية من الناحية البيولوجية من الجينوم.

يمكننا أيضًا اكتشاف أنماط غير عادية للاختيار من خلال النظر إلى نموذج احتمالي لتوزيع ثابت يختلف عن التوزيع في الخلفية. يوفر لنا تقدير ML لـ مصفوفة الوزن الاحتمالية (PWM) لكل k-mer في الجينوم بالإضافة إلى سجل درجات الاحتمالات للبدائل غير العادية (على سبيل المثال ، تغيير قاعدة واحدة إلى قاعدة واحدة وقاعدة أخرى فقط). كما قد يرى المرء من الشكل 4.4 ، فإن الأحرف المحددة مهمة لأن بعض القواعد تتغير بشكل انتقائي إلى قاعدة واحدة (أو قاعدتين أخريين) ، والقاعدة المحددة التي تتغير بها قد تشير إلى وظيفة التسلسل.

يمكننا زيادة قوة اكتشاف العناصر المقيدة من خلال النظر إلى المزيد من الأنواع ، كما هو موضح في الشكل 4.5 حيث نرى زيادة كبيرة في القدرة على اكتشاف العناصر المقيدة الصغيرة.


1 www.nature.com/nature/journal...ture06340.html


DNA (مكتبات الجينات): البناء والمكتبات الجينومية ومكتبات cDNA

مكتبة الحمض النووي هي مجموعة من الأجزاء المستنسخة التي تمثل مجتمعة جينات كائن حي معين. يمكن عزل جينات معينة من مكتبات الحمض النووي ، مثلما يمكن الحصول على الكتب من المكتبات التقليدية.

السر هو معرفة أين وكيف ننظر. هناك نوعان عامان من مكتبة الجينات: مكتبة الجينوم ، والتي تتكون من الحمض النووي الصبغي الكلي للكائن الحي ومكتبة (كدنا) ، والتي تمثل الحمض النووي الريبي من خلية أو نسيج في نقطة زمنية محددة.

يعتمد اختيار نوع معين من مكتبة الجينات على عدد من العوامل ، أهمها التطبيق النهائي لأي جزء من DNA مشتق من المكتبة. إذا كان الهدف النهائي يفهم التحكم في إنتاج البروتين لجين معين أو بنيته ، فيجب استخدام مكتبات الجينوم.

ومع ذلك ، إذا كان الهدف هو إنتاج بروتينات جديدة أو معدلة ، أو تحديد التعبير الخاص بالنسيج لأنماط التوقيت ، فإن مكتبات cDNA تكون أكثر ملاءمة. وبالتالي ، فإن الاعتبار الرئيسي في بناء مكتبات الجينوم أو (كدنا) هو مادة بدء الحمض النووي. نظرًا لأنه تم إصلاح جينوم الكائن الحي ، يمكن عزل الحمض النووي الصبغي من أي نوع من الخلايا تقريبًا من أجل تحضير الحمض النووي الجيني.

على النقيض من ذلك ، فإن مكتبات cDNA تمثل فقط mRNA الذي يتم إنتاجه من نوع خلية معين في وقت معين في تطوير الخلية & # 8217s. وبالتالي ، من المهم النظر بعناية في نوع الخلية أو الأنسجة التي يُشتق منها الرنا المرسال في بناء مكتبات (كدنا).

هناك مجموعة متنوعة من نواقل الاستنساخ المتاحة ، يعتمد العديد منها على جزيئات تحدث بشكل طبيعي مثل البلازميدات البكتيرية أو الفيروسات التي تصيب البكتيريا. يعتمد اختيار المتجه أيضًا على ما إذا كانت مكتبة الجينوم أو مكتبة cDNA قد تم إنشاؤها.

بناء مكتبات الجينات:

هضم جزيئات الحمض النووي الجينومي:

بعد عزل الحمض النووي الجيني وتنقيته ، يتم هضمه باستخدام نوكليازات مقيدة. هذه الإنزيمات هي مفتاح الاستنساخ الجزيئي بسبب الخصوصية التي تتمتع بها لتسلسلات معينة من الحمض النووي. من المهم ملاحظة أن كل نسخة من جزيء DNA معين من كائن حي معين ستعطي نفس مجموعة الشظايا عند هضمها بإنزيم معين.

سيعطي الحمض النووي من كائنات مختلفة ، بشكل عام ، مجموعات مختلفة من الشظايا عند معالجتها بنفس الإنزيم. من خلال هضم الحمض النووي الجيني المعقد من كائن حي ، يمكن تقسيم جينومه بشكل متكاثر إلى عدد كبير من الأجزاء الصغيرة ، كل منها بحجم جين واحد تقريبًا. تقطع بعض الإنزيمات مباشرة عبر الحمض النووي لإعطاء نهايات متدفقة أو غير حادة.

تقوم إنزيمات التقييد الأخرى بعمل قطوع متداخلة أحادية الخيط ، مما ينتج عنه إسقاطات قصيرة أحادية الجديلة عند كل طرف من نهايات الحمض النووي المهضوم. هذه الغايات ليست متطابقة فحسب ، بل مكملة لبعضها البعض وستتزاوج مع بعضها البعض ، وبالتالي ، تُعرف باسم النهايات المتماسكة أو اللاصقة. بالإضافة إلى ذلك ، فإن الإسقاط النهائي للحمض النووي رقم 5 & # 8242 يحتفظ دائمًا بمجموعات الفوسفات.

تم تمييز أكثر من 500 إنزيم تقييد ، يتعرف على أكثر من 200 موقع مختلف. يعتمد اختيار الإنزيم المراد استخدامه على عدد من العوامل. على سبيل المثال ، سيحدث تسلسل التعرف على 6 نقاط أساس ، في المتوسط ​​، كل 4096 (4 6) قاعدة ، بافتراض تسلسل عشوائي لكل من القواعد الأربع.

هذا يعني أن هضم الحمض النووي الجيني باستخدام EcoRI ، الذي يتعرف على التسلسل 5 & # 8242-GAATTC-3 & # 8242 ، سينتج أجزاء كل منها ، في المتوسط ​​، يزيد قليلاً عن 4 كيلو بايت. تنتج الإنزيمات ذات تسلسل التعرف 8 bp شظايا أطول بكثير. لذلك ، عادةً ما يتم هضم الجينومات الكبيرة جدًا ، مثل الحمض النووي البشري ، بالإنزيمات التي تنتج شظايا طويلة من الحمض النووي. هذا يجعل الخطوات اللاحقة أكثر قابلية للإدارة ، حيث يجب استنساخ عدد أقل من هذه الأجزاء وتحليلها لاحقًا.

ربط جزيئات الحمض النووي:

قد يتم ربط منتجات الحمض النووي الناتجة عن الهضم المقيد لتشكيل نهايات لزجة بأي شظايا أخرى من الحمض النووي تمت معالجتها بنفس إنزيم التقييد. وهكذا ، عندما يتم خلط مجموعتي الشظايا ، فإن الاقتران الأساسي بين النهايات اللاصقة سينتج عنه تلدين الأجزاء التي تم اشتقاقها من بداية DNA مختلفة. سيكون هناك أيضًا ، بالطبع ، أزواج من الأجزاء المشتقة من جزيئات الحمض النووي البادئة نفسها ، والتي يطلق عليها إعادة التلدين.

كل هذا الاقتران عابر ، بسبب ضعف الروابط الهيدروجينية بين القواعد القليلة في الأطراف اللاصقة ، ولكن يمكن تثبيتها باستخدام إنزيم ، DNA ligase ، في عملية تسمى الربط. عادة ما يتم عزل هذا الإنزيم من البكتيريا T4 ويسمى T4 DNA ligase ، ويشكل رابطة تساهمية بين 5 & # 8242- فوسفات في نهاية حبلا واحد و 3 & # 8242-هيدروكسيل من الخيط المجاور.

غالبًا ما يتم إجراء التفاعل الذي يعتمد على ATP عند 10 درجات مئوية لخفض الطاقة الحركية للجزيئات ، وبالتالي تقليل فرص انفصال الأطراف اللاصقة المزدوجة قبل أن يتم تثبيتها عن طريق الربط. ومع ذلك ، هناك حاجة إلى أوقات رد فعل طويلة للتعويض عن النشاط المنخفض ليجاز الحمض النووي في البرد. من الممكن أيضًا الانضمام إلى نهايات غير حادة لجزيئات الحمض النووي ، على الرغم من أن كفاءة هذا التفاعل أقل بكثير مما هي عليه في عمليات الربط اللاصقة.

نظرًا لأن الربط يعيد بناء موقع الانقسام ، يمكن شق الجزيئات المؤتلفة الناتجة عن ربط الأطراف اللاصقة مرة أخرى في & # 8216joins & # 8217 ، باستخدام نفس إنزيم التقييد الذي تم استخدامه لتوليد الأجزاء في البداية. من أجل نشر الحمض النووي المهضوم من كائن حي ، من الضروري ربط أو ربط هذا الحمض النووي بجزيء ناقل DNA متخصص يسمى ناقل.

يتم إدخال كل جزء من الحمض النووي عن طريق الربط في جزيء ناقل DNA ، مما يسمح بتكرار الحمض النووي المؤتلف بالكامل إلى أجل غير مسمى داخل الخلايا الميكروبية. بهذه الطريقة يمكن استنساخ جزء من الحمض النووي لتوفير مادة كافية لمزيد من التحليل التفصيلي أو لمزيد من التلاعب. وبالتالي ، فإن كل الحمض النووي المستخرج من كائن حي ويتم هضمه باستخدام إنزيم مقيد سيؤدي إلى مجموعة من الحيوانات المستنسخة. تُعرف هذه المجموعة من الحيوانات المستنسخة بمكتبة الجينات.

مكتبات الجينوم:

يشكل أي جين معين جزءًا صغيرًا فقط من جينوم الكائن الحي. على سبيل المثال ، إذا كان الكائن الحي من الثدييات التي يشمل جينومها بالكامل حوالي 106 كيلو بايت والجين 10 كيلو بايت ، فإن الجين يمثل 0.001 ٪ فقط من إجمالي الحمض النووي. من غير العملي محاولة استعادة مثل هذه التسلسلات النادرة مباشرة من الحمض النووي المعزول بسبب الكم الهائل من تسلسلات الحمض النووي الدخيلة.

بدلاً من ذلك ، يتم إعداد مكتبة الجينوم عن طريق عزل الحمض النووي الكلي من الكائن الحي ، وهضمه إلى أجزاء ذات حجم مناسب ، واستنساخ الأجزاء في ناقل مناسب. يُطلق على هذا النهج الاستنساخ بالبندقية لأن الاستراتيجية ليس لديها طريقة لاستهداف جين معين ولكنها تسعى بدلاً من ذلك إلى استنساخ جميع جينات الكائن الحي في وقت واحد.

القصد من ذلك هو أن تحتوي نسخة واحدة مؤتلفة على الأقل على جزء من الجين محل الاهتمام. يمكن تحقيق ذلك عن طريق الهضم الجزئي المحدود باستخدام إنزيم يتعرف على تسلسل رباعي النوكليوتيدات. سيؤدي الهضم الكامل بمثل هذا الإنزيم إلى إنتاج عدد كبير من الأجزاء القصيرة جدًا ، ولكن إذا تم السماح للإنزيم بالانشقاق فقط في عدد قليل من مواقع تقييده المحتملة قبل إيقاف التفاعل ، فسيتم تقطيع كل جزيء DNA إلى أجزاء كبيرة نسبيًا.

وسيعتمد متوسط ​​حجم الجزء على التركيزات النسبية للحمض النووي وإنزيم التقييد ، وعلى وجه الخصوص ، على ظروف ومدد الحضانة. من الممكن أيضًا إنتاج أجزاء من الحمض النووي عن طريق القص المادي ، على الرغم من أن نهايات الشظايا قد تحتاج إلى الإصلاح لجعلها منتهية. يتم تحقيق ذلك باستخدام بوليميراز DNA معدل يسمى Klenow polymerase.

يتم تحضير هذا عن طريق انشقاق بوليميراز الحمض النووي مع استخدام فرعي ، مما يعطي جزء إنزيم كبير ليس له نشاط نوكلياز خارجي 5 & # 8217 → 3 & # 8242 ، ولكنه لا يزال يعمل كـ 5 & # 8217 → 3 & # 8242 بوليميراز. باستخدام dNTPs المناسبة ، سيؤدي ذلك إلى ملء أي نهايات مجوفة 3 & # 8242 على الحمض النووي المنفصمة. يتم بعد ذلك ربط خليط شظايا الحمض النووي بناقل ، ثم يتم استنساخه لاحقًا.

إذا تم إنتاج عدد كافٍ من الحيوانات المستنسخة ، فستكون هناك فرصة كبيرة جدًا لوجود أي جزء معين من الحمض النووي ، مثل الجين ، في واحد على الأقل من الحيوانات المستنسخة. للحفاظ على عدد الحيوانات المستنسخة بحجم يمكن التحكم فيه ، يلزم وجود أجزاء يبلغ طولها حوالي 10 كيلو بايت للمكتبات بدائية النواة ، ولكن يجب زيادة الطول إلى حوالي 40 كيلو بايت لمكتبات الثدييات.

تم إعداد مكتبات الجينوم من مئات الأنواع المختلفة. يجب إنشاء العديد من الحيوانات المستنسخة للتأكد من أن مكتبة الجينوم تحتوي على الجين محل الاهتمام. الاحتمال ، P ، أن عددًا ما من الحيوانات المستنسخة ، N ، يحتوي على جزء معين يمثل جزءًا ، f ، من الجينوم هو

على سبيل المثال ، إذا كانت المكتبة تتكون من 10 أجزاء kbp من جينوم E. coli (إجمالي 4640 kbp) ، يجب فحص أكثر من 2000 نسخة فردية للحصول على احتمال 99٪ (P = 0.99) للعثور على جزء معين. بما أن / = 10/4640 = 0.0022 و P & # 8211 0.99 ، N = 2093. بالنسبة لاحتمال 99٪ لإيجاد تسلسل معين ضمن الجينوم البشري 3 × 10 6 كيلو بايت في الثانية ، فإن N تساوي 1.4 مليون تقريبًا إذا كان متوسط ​​الأجزاء المستنسخة حجم 10 كيلوبايت. إن الحاجة إلى نواقل استنساخ قادرة على حمل إدخالات كبيرة جدًا من الحمض النووي تصبح واضحة من هذه الأرقام.

مكتبات اندماجية:

يعتبر التعرف والربط المحدد للجزيئات الأخرى سمة مميزة لأي بروتين أو حمض نووي. في كثير من الأحيان ، تكون الروابط المستهدفة لبروتين معين غير معروفة ، أو في حالات أخرى ، يمكن البحث عن رابط فريد لبروتين معروف على أمل إعاقة نشاط البروتين أو الإخلال بوظيفته بطريقة أخرى.

المكتبات التوافقية هي نتاج الاستراتيجيات الناشئة لتسهيل تحديد وتوصيف الروابط المحتملة للبروتين. تنطبق هذه الاستراتيجيات أيضًا على دراسة الأحماض النووية. على عكس المكتبات الجينومية ، تتكون المكتبات التوافقية من أوليغومرات تركيبية. تُعرف مصفوفات الأوليغنوكليوتيدات الاصطناعية المطبوعة كنقاط صغيرة على دعامات صلبة مصغرة باسم رقائق الحمض النووي.

على وجه التحديد ، تحتوي المكتبات التوافقية على أعداد كبيرة جدًا من الجزيئات المركبة كيميائيًا (مثل الببتيدات أو قليل النوكليوتيدات) مع متواليات أو هياكل عشوائية. تم تصميم وإنشاء مثل هذه المكتبات على أمل أن يتم التعرف على جزيء واحد من بين عدد كبير على أنه يجند بواسطة البروتين (أو الحمض النووي) محل الاهتمام.

إذا كان الأمر كذلك ، فربما يكون هذا الجزيء مفيدًا في التطبيقات الصيدلانية ، على سبيل المثال كدواء لعلاج مرض ينطوي على البروتين الذي يرتبط به. مثال على هذه الاستراتيجية هو إعداد مكتبة اندماجية تركيبية من هيكسا ببتيدات. الحد الأقصى لعدد مجموعات التسلسل لـ hexapeptides هو 20 6 أو 64.000.000.

تتمثل إحدى الطرق لتبسيط إمكانيات التحضير والفرز لمثل هذه المكتبة في تحديد أول اثنين من الأحماض الأمينية في هيكسا ببتيد بينما يتم اختيار الأربعة التالية بشكل عشوائي. في هذا النهج ، يتم تصنيع 400 مكتبة (20 2) ، كل منها فريدة من نوعها من حيث الأحماض الأمينية في الموضعين 1 و 2 ولكنها عشوائية في المواضع الأربعة الأخرى (كما في AAXXXX ، و ACXXXX ، و ADXXXX ، وما إلى ذلك) بحيث تحتوي كل مكتبة من 400 مكتبة على 20 4 أو 160000 مجموعة تسلسل مختلفة.

يكشف فحص هذه المكتبات بالبروتين ذي الأهمية عن أي مكتبة من 400 مكتبة تحتوي على ترابط ذي صلة عالية. يتم بعد ذلك توسيع هذه المكتبة بشكل منهجي عن طريق تحديد أول 3 أحماض أمينية (مع العلم من بين 1 من 400 مكتبة مختارة من الأحماض الأمينية هي الأفضل كأول 2) فقط 20 مكتبة تركيبية (تحتوي كل منها على 20 3 أو 8000 هيكسا ببتيد) هنا (واحد لكل احتمال المركز الثالث ، يتم اختيار المراكز الثلاثة المتبقية بشكل عشوائي).

يكشف اختيار ارتباط الترابط ، مرة أخرى مع البروتين ذي الأهمية ، عن أفضل هذه العناصر العشرين ، ثم يتم تغيير هذه المكتبة الخاصة بشكل منهجي في الموضع الرابع ، مما يؤدي إلى إنشاء 20 مكتبة أخرى (تحتوي كل منها على 20 2 أو 400 هيكسا ببتيد). تتكرر هذه الدورة من التوليف والفحص والاختيار حتى يتم تحسين جميع المواضع الستة في هيكسا ببتيد لإنشاء أفضل رابط للبروتين.

حدد تباين في هذه الإستراتيجية الأساسية باستخدام أليغنوكليوتيدات اصطناعية بدلاً من الببتيدات وجود 15 مير فريد (تسلسل GGTTGGTGTGTTGG) مع تقارب عالٍ (Kد = 2.7 نانومتر) نحو الثرومبين ، وهو بروتين سيرين في مسار تخثر الدم. الثرومبين هو هدف رئيسي للوقاية الدوائية من تكوين الجلطة في تجلط الدم التاجي.

مكتبات الفرز:

تتمثل إحدى الطرق الشائعة لفحص المكتبات الجينومية القائمة على البلازميد في إجراء تجربة تهجين مستعمرة. البروتوكول مشابه للمكتبات المستندة إلى الملتهمة باستثناء أنه يتم فحص لويحات العاثية ، وليس المستعمرات البكتيرية. في تجربة نموذجية ، تُطلى البكتيريا المضيفة التي تحتوي إما على مكتبة قائمة على البلازميد أو على أساس العاثية على طبق بتري ويُسمح لها بالنمو بين عشية وضحاها لتشكيل مستعمرات (أو في حالة مكتبات العاثيات ، اللوحات) (الشكل 4.10).

ثم يتم الحصول على نسخة طبق الأصل من المستعمرات البكتيرية (أو اللويحات) عن طريق تراكب الصفيحة بقرص النيتروسليلوز. تتم إزالة القرص ، ومعالجته بالقلويات لفصل الدنا المزدوج المربوط إلى DNA أحادي الجديلة ، وتجفيفه ، ووضعه في كيس محكم الغلق مع مسبار عليه علامة. إذا كان DNA المسبار عبارة عن DNA مزدوج ، فيجب تغيير طبيعته عن طريق التسخين عند 70 درجة مئوية.

يجب أن يكون المسبار والتسلسل التكميلي للحمض النووي المستهدف في شكل واحد تقطعت به السبل إذا كان عليهما التهجين مع بعضهما البعض. سيتم الكشف عن أي تسلسل DNA مكمل لسبر الحمض النووي عن طريق التصوير الشعاعي لقرص النيتروسليلوز. يتم تحديد المستعمرات البكتيرية (لويحات الملتهمة) التي تحتوي على الحيوانات المستنسخة التي تحمل الحمض النووي المستهدف على الفيلم ويمكن استعادتها من اللوحة الرئيسية.

مجسات للتهجين الجنوبي:

من الواضح أن تحقيقات محددة هي كواشف أساسية إذا كان الهدف هو تحديد جين معين على خلفية من تسلسلات الحمض النووي التي لا حصر لها. عادةً ما تكون المجسات المستخدمة في فحص المكتبات عبارة عن تسلسلات نيوكليوتيدات مكملة لجزء من الجين المستهدف. لعمل تحقيقات مفيدة يتطلب بعض المعلومات حول تسلسل النوكليوتيدات الجين & # 8217s.

في بعض الأحيان تكون هذه المعلومات متاحة. بدلاً من ذلك ، إذا كان تسلسل الأحماض الأمينية للبروتين المشفر بواسطة الجين معروفًا ، فمن الممكن العمل بشكل عكسي من خلال الشفرة الجينية إلى تسلسل الحمض النووي (الشكل 4.11). نظرًا لأن الكود الجيني يتحلل (أي أن العديد من الكودونات قد تحدد نفس الحمض الأميني) ، فإن المجسات المصممة من خلال هذا النهج عادة ما تكون قليلة النوكليوتيدات المتحللة من 17 إلى 50 وحدة بنائية (تسمى هذه قليلات النوكليوتيدات بـ 17 إلى 50 مترًا).

يتم تصنيع قليل النيوكليوتيدات بحيث يتم دمج قواعد مختلفة في المواقع التي تحدث فيها حالات الانحلال في الكودونات. وهكذا يتكون التحضير النهائي من خليط من قليل النوكليوتيدات متساوية الطول والتي تختلف تسلسلها لتلائم حالات الانحلال. من المفترض أن تسلسل قليل النوكليوتيد في الخليط سوف يتهجين مع الجين المستهدف.هذه المجسات قليلة النوكليوتيد لا تقل عن 17 ميكرومترًا لأن قليلات النوكليوتيدات الأقصر المتحللة قد تتهجين مع متواليات لا علاقة لها بالتسلسل المستهدف.

يمكن أيضًا استخدام قطعة من الحمض النووي من الجين المقابل في كائن حي ذي صلة كمسبار في فحص مكتبة لجين معين. يُطلق على هذه المجسات اسم تحقيقات غير متجانسة لأنها غير مشتقة من الكائن المتماثل (نفسه). تنشأ المشاكل إذا كان جين حقيقي النواة الكامل هو هدف الاستنساخ يمكن أن تكون جينات حقيقيات النوى في الحجم عشرات أو حتى مئات من أزواج الكيلوغرامات.

الجينات بهذا الحجم مجزأة في معظم إجراءات الاستنساخ. وبالتالي ، فإن الحمض النووي الذي حدده المسبار قد يمثل استنساخًا يحمل جزءًا فقط من الجين المطلوب. ومع ذلك ، فإن معظم استراتيجيات الاستنساخ تعتمد على الهضم الجزئي للحمض النووي الجيني ، وهي تقنية تولد مجموعة متداخلة من الأجزاء الجينومية.

في هذه الحالة ، يمكن الآن استخدام أجزاء الحمض النووي من نهايات الاستنساخ المحدد لفحص المكتبة بحثًا عن الحيوانات المستنسخة التي تحمل تسلسلات الحمض النووي التي تحيط بالعزلة الأصلية في الجينوم. يؤدي تكرار هذه العملية في النهاية إلى إنتاج الجين الكامل بين مجموعة فرعية من الحيوانات المستنسخة المتداخلة.

مكتبات (كدنا):

cDNAs هي جزيئات DNA منسوخة من قوالب mRNA. يتم إنشاء مكتبات (كدنا) عن طريق تخليق (كدنا) من مرنا الخلوي المنقى. تقدم هذه المكتبات استراتيجية بديلة لعزل الجينات ، وخاصة الجينات حقيقية النواة. نظرًا لأن معظم mRNAs حقيقية النواة تحمل 3 & # 8242-poly (A) ذيول ، يمكن عزل mRNA بشكل انتقائي من مستحضرات الحمض النووي الريبي الخلوي الكلي بواسطة كروماتوجرافيا oligo (dT) - السلولوز (الشكل 4.12). يتم تصنيع نسخ DNA من mRNAs المنقى عن طريق التلدين الأول لسلاسل oligo القصيرة (dT) إلى ذيول بولي (A).

هذه السلاسل oligo (dT) بمثابة بادئات لتخليق DNA يحركها النسخ العكسي (الشكل 4.13). (يمكن أيضًا استخدام قليل النوكليوتيدات العشوائية كبادئات أولية ، مع وجود مزايا أقل اعتمادًا على المسالك المتعددة (A) وزيادة احتمالية تكوين مستنسخات تمثل النهايات 5 & # 8242 من mRNAs.) النسخ العكسي هو إنزيم يصنع خيطًا من الحمض النووي ، نسخ RNA كقالب. ثم يتم استخدام بوليميراز الدنا لنسخ خيط الدنا وتشكيل جزيء مزدوج الشريطة (دنا مزدوج).

ربط شظايا الحمض النووي غير الحادة ليست فعالة مثل ربط الأطراف اللزجة ، لذلك مع جزيئات cDNA يتم اتخاذ إجراءات إضافية قبل الربط مع نواقل الاستنساخ. تتمثل إحدى الطرق في إضافة جزيئات cDNA صغيرة ومزدوجة تقطعت بهم السبل مع موقع داخلي واحد من أجل نوكلياز داخلي مقيد ، ويطلق عليها روابط الحمض النووي. تتوفر العديد من الروابط تجارياً مع قيود داخلية للعديد من إنزيمات التقييد الأكثر استخدامًا.

الوصلات مرتبطة بنهاية حادة بـ (كدنا) ولكن بما أنها تضاف أكثر بكثير من (كدنا) ، فإن عملية الربط تكون ناجحة بشكل معقول. بعد ذلك يتم هضم الوصلات باستخدام إنزيم التقييد المناسب ، والذي يوفر النهايات اللاصقة للربط الفعال بالناقل المهضوم بنفس الإنزيم. قد تكون هذه العملية أسهل من خلال إضافة محولات بدلاً من الوصلات ، والتي تكون متطابقة باستثناء أن الأطراف اللاصقة يتم تنفيذها وبالتالي ليست هناك حاجة لتقييد الهضم بعد الربط.

لذلك ، أخيرًا تضاف الروابط إلى ازدواج DNA التي يتم تقديمها من قوالب mRNA ، ويتم استنساخ cDNA في ناقل مناسب. بمجرد تحديد cDNA المشتق من جين معين ، يصبح cDNA مجسًا فعالًا لفحص مكتبات الجينوم لعزل الجين نفسه.

نظرًا لأن أنواع الخلايا المختلفة في الكائنات حقيقية النواة تعبر عن مجموعات فرعية مختارة من الجينات ، فإن تحضيرات الحمض النووي الريبي من الخلايا أو الأنسجة التي يتم فيها نسخ الجينات ذات الأهمية بشكل انتقائي يتم إثرائها من أجل الرنا المرسال المطلوب. تعد مكتبات (كدنا) المعدة من هذا الرنا المرسال ممثلة لنمط ومدى التعبير الجيني الذي يحدد بشكل فريد أنواعًا معينة من الخلايا المتمايزة.

مكتبات (كدنا) للعديد من أنواع الخلايا البشرية السليمة والمريضة متاحة تجارياً ، بما في ذلك مكتبات (كدنا) للعديد من الخلايا السرطانية. تعتبر المقارنة بين مكتبات (كدنا) العادية وغير الطبيعية ، بالاقتران مع التحليل الكهربائي للهلام ثنائي الأبعاد للبروتينات المنتجة في الخلايا الطبيعية وغير الطبيعية ، استراتيجية جديدة واعدة في الطب السريري لفهم آليات المرض.


مقدمة

مع الحاجة الملحة لفهم الجينوم والطفرات الخاصة بـ SARS-CoV-2 بشكل أفضل ، أصبحت محاذاة التسلسل متعدد السلالات لفيروسات كورونا (CoV) متاحة 1 حيث يتم محاذاة تسلسلات متعددة من CoV ضد الجينوم المرجعي SARS-CoV-2. توفر محاذاة التسلسل معلومات مهمة عن التاريخ التطوري للقواعد الجينية المختلفة. يمكن أن تكون مثل هذه المعلومات مفيدة في تفسير الطفرات ، على سبيل المثال ، تم إثراء القواعد ذات قيود التسلسل القوي أو التطور المتسارع للمتغيرات المرتبطة بالنمط الظاهري 2،3. في حين أن التعليقات التوضيحية النظامية الحالية التي تحدد قيود التسلسل الكمي من المحاذاة 4،5 مفيدة ، فإنها تقلل المعلومات الموجودة في المحاذاة الأساسية إلى قيمة أحادية أو ثنائية واحدة وبالتالي فهي محدودة في المعلومات التي تنقلها. قد تكون المعلومات الإضافية حول الأنماط التي تتوافق مع تسلسل جينوم SARS-CoV-2 وتطابقها في كل قاعدة مفيدة في تحليل جينوم SARS-CoV-2 والطفرات.

كنهج تكميلي لطرق تسجيل قيود التسلسل ، تم تقديم ConsHMM مؤخرًا للتعليق بشكل منهجي على جينوم معين مع حالات الحفظ التي تلتقط الأنماط التوافقية والمكانية في محاذاة تسلسل متعدد الأنواع 6. تصمم ConsHMM على وجه التحديد ما إذا كانت القواعد من التسلسلات غير المرجعية تتماشى وتطابق كل قاعدة في الجينوم المرجعي. تعمل ConsHMM على توسيع ChromHMM ، وهي طريقة مستخدمة على نطاق واسع تستخدم نموذج ماركوف المخفي متعدد المتغيرات (HMM) لتعلم الأنماط في البيانات اللاجينومية من novo وشرح الجينوم بناءً على الأنماط المتعلمة 7. بصرف النظر عن محاذاة المدخلات التي تم إنشاؤها باستخدام أشجار النشوء والتطور ، لا تستخدم ConsHMM صراحة أي معلومات عن النشوء والتطور ، وبالتالي لا تضع أي افتراضات صارمة بشأن علاقة النشوء والتطور بين التسلسلات. يتيح ذلك لـ ConsHMM أن يكون أكثر مرونة في التقاط أنماط مختلفة ضمن المحاذاة من مناهج الجينوم المقارن الأكثر شيوعًا التي تحدد درجة قيد واحدة أو استدعاءات ثنائية للعناصر المقيدة بناءً على نمذجة النشوء والتطور. أظهر العمل السابق الذي يطبق ConsHMM على محاذاة الأنواع المتعددة للجينومات الأخرى أن حالات الحفظ التي تعلمتها ConsHMM تلتقط أنماطًا مختلفة في المحاذاة التي تم التغاضي عنها بواسطة الأساليب السابقة وهي مفيدة لتفسير عناصر الحمض النووي والمتغيرات المرتبطة بالنمط الظاهري 6،8.

بدافع من الحاجة الحالية إلى فهم جينوم SARS-CoV-2 والطفرات بشكل أفضل ، نطبق هنا ConsHMM على محاذاة تسلسل متعدد السلالات من CoV التي تم توفيرها مؤخرًا 1 وتعلم مجموعتين من حالات الحفظ. تتكون المحاذاة الأولى من Sarbecoviruses ، وهو جنس فرعي تحت جنس Betacoronavirus في عائلة Coronavirdae 9. تتكون هذه المحاذاة من SARS-CoV وفيروسات Sarbecovirus الأخرى التي تصيب الخفافيش المتوافقة مع جينوم SARS-CoV-2. تتكون المحاذاة الثانية من CoV الذي يصيب الفقاريات المختلفة (مثل الإنسان ، الخفافيش ، البنغول ، الفأر ، الطيور) المحاذاة مع جينوم SARS-CoV-2.

نظرًا لمجموعتين من حالات الحفظ التي تعلمتها ConsHMM من هاتين المحاذاة ، فإننا نعلق جينوم SARS-CoV-2 مع الحالات ونحلل علاقة الدول بالتعليقات التوضيحية الخارجية لفهم خصائصها. نلاحظ أن الدول تلتقط أنماطًا مميزة في بيانات محاذاة الإدخال. باستخدام التعليقات التوضيحية الخارجية للجينات ، ومناطق الاهتمام ، والطفرات التي لوحظت بين متواليات SARS-CoV-2 ، نلاحظ أن الدول لديها أيضًا أنماط إثراء مميزة لمختلف المناطق المشروحة. نقوم بإنشاء مسارات على مستوى الجينوم تسجل كل نيوكليوتيد بناءً على نضوب الحالة وإثرائها للطفرات المرصودة ، والتي يمكن استخدامها لتحديد أولويات القواعد التي من المرجح أن تكون فيها الطفرات نتيجة لذلك. بشكل عام ، يشير تحليلنا إلى أن حالات حفظ ConsHMM تسلط الضوء على القواعد الجينية ذات الأنماط التطورية المتميزة في محاذاة تسلسل الإدخال والأهمية البيولوجية المحتملة. تعد شروح حالة الحفظ ConsHMM ومسارات نضوب حالة الطفرات موارد لتفسير الجينوم والطفرات SARS-CoV-2.


7.2 تحديد وظائف الجينات الفردية

بمجرد تحديد الجين الجديد في تسلسل الجينوم ، يجب معالجة مسألة وظيفته. لقد تبين أن هذا مجال مهم لأبحاث علم الجينوم ، لأن مشاريع التسلسل المكتملة كشفت أننا نعرف أقل مما كنا نعتقد بشأن محتوى الجينوم الفردي. بكتريا قولونية و S. cerevisiae ، على سبيل المثال ، تمت دراستها بشكل مكثف من خلال التحليل الجيني التقليدي قبل ظهور مشاريع التسلسل ، وكان علماء الوراثة في وقت واحد واثقين إلى حد ما من أن معظم جيناتهم قد تم تحديدها. كشفت تسلسل الجينوم عن وجود فجوات كبيرة في معرفتنا. من بين 4288 جينة ترميز البروتين في بكتريا قولونية تسلسل الجينوم ، تم تحديد 1853 فقط (43 ٪ من الإجمالي) مسبقًا (Blattner وآخرون. ، 1997). ل S. cerevisiae كان الرقم 30٪ فقط (دوجون ، 1996).

كما هو الحال مع موقع الجين ، تتم محاولات تحديد وظائف الجينات غير المعروفة عن طريق تحليل الكمبيوتر والدراسات التجريبية.

7.2.1. تحليل الحاسوب لوظيفة الجينات

لقد رأينا بالفعل أن تحليل الكمبيوتر يلعب دورًا مهمًا في تحديد موقع الجينات في تسلسل الحمض النووي ، وأن أحد أقوى الأدوات المتاحة لهذا الغرض هو البحث عن التماثل ، والذي يحدد موقع الجينات من خلال مقارنة تسلسل الحمض النووي قيد الدراسة مع جميع تسلسلات الحمض النووي الأخرى في قواعد البيانات. أساس البحث عن التماثل هو أن الجينات ذات الصلة لها تسلسلات متشابهة وبالتالي يمكن اكتشاف جين جديد بحكم تشابهه مع جين مكافئ ، متسلسل بالفعل ، من كائن حي مختلف. الآن سننظر عن كثب في تحليل التنادد ونرى كيف يمكن استخدامه لتعيين وظيفة لجين جديد.

التنادد يعكس العلاقات التطورية

الجينات المتماثلة هي تلك التي تشترك في سلف تطوري مشترك ، ويتضح ذلك من خلال التشابه المتسلسل بين الجينات. تشكل أوجه التشابه هذه البيانات التي تستند إليها السلالات الجزيئية ، كما سنرى في الفصل 16. تنقسم الجينات المتجانسة إلى فئتين:

لا يحتوي زوج من الجينات المتماثلة عادةً على تسلسلات نيوكليوتيد متطابقة ، لأن الجينين يخضعان لتغيرات عشوائية مختلفة عن طريق الطفرة ، لكن لهما تسلسلات متشابهة لأن هذه التغييرات العشوائية قد عملت على نفس تسلسل البداية ، جين السلف المشترك. يستفيد بحث التنادد من هذه التشابهات في التسلسل. أساس التحليل هو أنه إذا تبين أن الجين المتسلسل حديثًا يشبه الجين المتسلسل سابقًا ، فيمكن استنتاج علاقة تطورية ومن المرجح أن تكون وظيفة الجين الجديد هي نفسها ، أو على الأقل مماثلة ، وظيفة الجين المعروف.

من المهم عدم الخلط بين الكلمات تنادد و تشابه. من الخطأ وصف زوج من الجينات ذات الصلة بأنه & # x0201880٪ متماثل & # x02019 إذا كانت متوالياتهما تحتوي على هوية نيوكليوتيد بنسبة 80٪ (الشكل 7.9). زوج من الجينات إما مرتبطان تطوريًا أو أنهما لا توجد بينهما مواقف ، وبالتالي لا معنى لإسناد قيمة النسبة المئوية إلى التماثل.

الشكل 7.9

تسلسلان من الحمض النووي بهوية تسلسل 80٪.

يمكن لتحليل التنادد أن يوفر معلومات عن وظيفة جين كامل أو أجزاء بداخله

يمكن إجراء بحث التماثل باستخدام تسلسل الحمض النووي ولكن عادةً ما يتم تحويل تسلسل الجينات المؤقت إلى تسلسل الحمض الأميني قبل إجراء البحث. أحد أسباب ذلك هو وجود 20 نوعًا من الأحماض الأمينية المختلفة في البروتينات ولكن هناك أربعة نيوكليوتيدات فقط في الحمض النووي ، لذلك تبدو الجينات غير المرتبطة عادةً أكثر اختلافًا عن بعضها البعض عند مقارنة تسلسل الأحماض الأمينية (الشكل 7.10). لذلك ، من غير المرجح أن يعطي بحث التنادد نتائج زائفة إذا تم استخدام التسلسل الأميني. إن الجوانب العملية للبحث عن التنادد ليست شاقة على الإطلاق. توجد العديد من البرامج لهذا النوع من التحليل ، وأكثرها شيوعًا هي BLAST (أداة بحث المحاذاة المحلية الأساسية Altschul وآخرون. ، 1990). يمكن إجراء التحليل ببساطة عن طريق تسجيل الدخول إلى موقع الويب الخاص بإحدى قواعد بيانات الحمض النووي وإدخال التسلسل في أداة البحث عبر الإنترنت.

الشكل 7.10

غالبًا ما يكون الافتقار إلى التماثل بين تسلسلين أكثر وضوحًا عند إجراء المقارنات على مستوى الأحماض الأمينية. يتم عرض تسلسلين من النيوكليوتيدات ، مع وجود نيوكليوتيدات متطابقة في التسلسلين المعطيين باللون الأحمر وغير المتطابقين باللون الأزرق. (أكثر. )

قد يعطي التطابق الإيجابي لجين موجود بالفعل في قاعدة البيانات إشارة واضحة إلى وظيفة الجين الجديد ، أو قد تكون الآثار المترتبة على التطابق أكثر دقة. على وجه الخصوص ، قد تحتوي الجينات التي ليس لها ارتباط تطوري واضح على أجزاء قصيرة متشابهة مع بعضها البعض. غالبًا ما يكون تفسير ذلك هو أنه على الرغم من عدم ارتباط الجينات ، فإن بروتيناتها لها وظائف متشابهة ويقوم التسلسل المشترك بترميز مجال داخل كل بروتين يكون مركزيًا لتلك الوظيفة المشتركة. على الرغم من أن الجينات نفسها ليس لها سلف مشترك ، فإن المجالات تفعل ذلك ، ولكن مع وجود سلفهم المشترك في وقت قديم جدًا ، تطورت المجالات المتجانسة لاحقًا ليس فقط من خلال تغييرات النوكليوتيدات المفردة ، ولكن أيضًا من خلال عمليات إعادة ترتيب أكثر تعقيدًا خلقت جينات جديدة داخل التي تم العثور على المجالات (القسم 15.2.1). يتم توفير مثال مثير للاهتمام من خلال مجال tudor ، وهو عبارة عن نموذج مكون من 120 حمض أميني تم تحديده لأول مرة في تسلسل ذبابة الفاكهة سوداء البطن يسمى الجين تيودور (بونتينج ، 1997). البروتين المشفر بواسطة تيودور يتكون الجين ، الذي تكون وظيفته غير معروفة ، من عشر نسخ من مجال تيودور ، واحدة تلو الأخرى (الشكل 7.11). كشف بحث تجانس باستخدام مجال tudor كاختبار أن العديد من البروتينات المعروفة تحتوي على هذا المجال. تسلسل هذه البروتينات ليست متشابهة إلى حد كبير مع بعضها البعض وليس هناك ما يشير إلى أنها متجانسة حقيقية ، لكنها تمتلك جميعًا مجال تيودور. تشمل هذه البروتينات واحدة تشارك في نقل الحمض النووي الريبي أثناء ذبابة الفاكهة oogenesis ، وهو بروتين بشري له دور في استقلاب الحمض النووي الريبي ، والبروتينات الأخرى التي يبدو أن أنشطتها تنطوي على الحمض النووي الريبي بطريقة أو بأخرى. لذلك يشير تحليل التماثل إلى أن تسلسل تيودور يلعب دورًا ما في التفاعل بين البروتين وركيزة الحمض النووي الريبي الخاص به. المعلومات من تحليل الكمبيوتر غير كاملة في حد ذاتها ، لكنها تشير إلى الطريق إلى أنواع التجارب التي يجب القيام بها للحصول على المزيد من البيانات الواضحة حول وظيفة مجال تيودور.

الشكل 7.11

مجال تيودور. يظهر الرسم العلوي هيكل ذبابة الفاكهة بروتين تيودور ، والذي يحتوي على عشر نسخ من مجال تيودور. تم العثور على المجال أيضًا في ثانية ذبابة الفاكهة بروتين، بلا مأوى، وفي بروتين مرساة A-kinase البشري (AKAP149) ، (المزيد)

تحليل التنادد في مشروع جينوم الخميرة

ال س. وقد أوضح مشروع الجينوم cerevisiae كلاً من إمكانات وحدود تحليل التنادد كوسيلة لتعيين وظائف للجينات الجديدة. يحتوي جينوم الخميرة على ما يقرب من 6000 جين ، تم تحديد 30 ٪ منها عن طريق التحليل الجيني التقليدي قبل بدء مشروع التسلسل. تمت دراسة 70 ٪ المتبقية من خلال تحليل التماثل ، مع إعطاء النتائج التالية (الشكل 7.12 Dujon ، 1996):

الشكل 7.12

فئات الجينات في جينوم الخميرة.

7.2.2. تحديد الوظيفة الجينية بالتحليل التجريبي

من الواضح أن تحليل التنادد ليس حلاً سحريًا يمكنه تحديد وظائف جميع الجينات الجديدة. لذلك ، هناك حاجة إلى الأساليب التجريبية لاستكمال وتوسيع نتائج دراسات التماثل. ثبت أن هذا هو أحد أكبر التحديات في أبحاث علم الجينوم ، ويتفق معظم علماء الأحياء الجزيئية على أن المنهجيات والاستراتيجيات المستخدمة حاليًا ليست كافية تمامًا لتعيين وظائف لأعداد هائلة من الجينات غير المعروفة التي يتم اكتشافها من خلال مشاريع التسلسل. تكمن المشكلة في أن الهدف - رسم مسار من الجين إلى الوظيفة - هو عكس المسار الذي يسلكه التحليل الجيني عادةً ، حيث تكون نقطة البداية هي النمط الظاهري والهدف هو تحديد الجين أو الجينات الأساسية. تأخذنا المشكلة التي نعالجها حاليًا في الاتجاه المعاكس: البدء بجين جديد ونأمل أن تؤدي إلى تحديد النمط الظاهري المرتبط.

التحليل الوظيفي عن طريق تعطيل الجينات

في التحليل الجيني التقليدي ، عادة ما يتم دراسة الأساس الجيني للنمط الظاهري من خلال البحث عن الكائنات الحية الطافرة التي تغير فيها النمط الظاهري. يمكن الحصول على الطفرات بشكل تجريبي ، على سبيل المثال عن طريق معالجة مجموعة من الكائنات الحية (مثل ثقافة البكتيريا) بالأشعة فوق البنفسجية أو مادة كيميائية مطفرة (انظر القسم 14.1.1) ، أو قد تكون الطفرات موجودة في مجموعة طبيعية. يتم بعد ذلك دراسة الجين أو الجينات التي تم تغييرها في الكائن الحي المتحور عن طريق التهجينات الجينية (القسم 5.2.4) ، والتي يمكن أن تحدد موضع الجين في الجينوم وأيضًا تحديد ما إذا كان الجين هو نفسه الذي سبق له تم تمييزه. يمكن بعد ذلك دراسة الجين بشكل أكبر من خلال تقنيات البيولوجيا الجزيئية مثل الاستنساخ والتسلسل.

المبدأ العام لهذا التحليل التقليدي هو أنه يمكن تحديد الجينات المسؤولة عن النمط الظاهري من خلال تحديد الجينات المعطلة في الكائنات الحية التي تظهر نسخة متحولة من النمط الظاهري. إذا كانت نقطة البداية هي الجين ، وليس النمط الظاهري ، فإن الإستراتيجية المكافئة ستكون تحوير الجين وتحديد التغيير المظهرى الناتج. هذا هو أساس معظم التقنيات المستخدمة لتعيين وظائف لجينات غير معروفة.

يمكن تعطيل الجينات الفردية عن طريق إعادة التركيب المتماثل

أسهل طريقة لتعطيل جين معين هو تعطيله بجزء غير ذي صلة من الحمض النووي (الشكل 7.13). يمكن تحقيق ذلك عن طريق إعادة التركيب المتماثل بين النسخة الكروموسومية للجين وقطعة ثانية من الحمض النووي تشترك في بعض هوية التسلسل مع الجين المستهدف. إعادة التركيب المتماثل (وأنواع أخرى) هي أحداث معقدة ، والتي سنتعامل معها بالتفصيل في القسم 14.3.1. للأغراض الحالية ، يكفي معرفة أنه إذا كان لجزيئين من الحمض النووي تسلسلات متشابهة ، فإن إعادة التركيب يمكن أن يؤدي إلى تبادل أجزاء من الجزيئات.

الشكل 7.13

تعطيل الجينات عن طريق إعادة التركيب المتماثل. تتحد النسخة الكروموسومية للجين المستهدف مع نسخة معطلة من الجين يحملها ناقل استنساخ. نتيجة لذلك ، يصبح الجين المستهدف معطلاً. لمزيد من المعلومات حول إعادة التركيب (المزيد).

كيف يتم تعطيل الجينات عمليا؟ سننظر في مثالين ، الأول به س. الخباز. منذ الانتهاء من تسلسل الجينوم في عام 1996 ، شرع علماء الأحياء الجزيئية للخميرة في جهد دولي منسق لتحديد وظائف أكبر عدد ممكن من الجينات اليتيمة (أوليفر ، 1996 ب). يتم عرض إحدى التقنيات المستخدمة في الشكل 7.14 (Wach وآخرون. ، 1994).المكون المركزي هو & # x02018deletion cassette & # x02019 ، والذي يحمل جينًا لمقاومة المضادات الحيوية. هذا الجين ليس مكونًا طبيعيًا في جينوم الخميرة ولكنه سيعمل إذا تم نقله إلى كروموسوم الخميرة ، مما يؤدي إلى ظهور خلية خميرة محولة مقاومة لمضادات الجينات الوراثية. قبل استخدام شريط الحذف ، يتم إرفاق أجزاء جديدة من الحمض النووي كذيول في أي من الطرفين. تحتوي هذه الأجزاء على تسلسلات مماثلة لأجزاء من جين الخميرة التي سيتم تعطيلها. بعد إدخال الكاسيت المعدل في خلية الخميرة ، يحدث إعادة التركيب المتماثل بين ذيول الحمض النووي والنسخة الصبغية من جين الخميرة ، لتحل محل الأخير مع الجين المقاوم للمضادات الحيوية. لذلك يتم اختيار الخلايا التي خضعت للاستبدال عن طريق تصفيح المزرعة على وسط أجار يحتوي على الجينات. تفتقر المستعمرات الناتجة إلى نشاط الجين المستهدف ويمكن فحص أنماطها المظهرية لاكتساب بعض التبصر في وظيفة الجين.

الشكل 7.14

استخدام كاسيت حذف الخميرة. يتكون شريط الحذف من جين مقاوم للمضادات الحيوية مسبوقًا بتسلسلات المحفز اللازمة للتعبير في الخميرة ، ويحيط به موقعان للتقييد. مقاطع البداية والنهاية للجين المستهدف (المزيد).

يستخدم المثال الثاني لتعطيل الجينات عملية مماثلة ولكن مع الفئران بدلاً من الخميرة. كثيرًا ما يستخدم الفأر ككائن حي نموذجي للبشر لأن جينوم الفأر مشابه للجينوم البشري ، ويحتوي على العديد من الجينات نفسها. لذلك يتم تحديد وظائف الجينات البشرية غير المعروفة إلى حد كبير عن طريق تعطيل الجينات المكافئة في الفأر ، وهذه التجارب لا يمكن تصورها أخلاقيا مع البشر. يتطابق جزء إعادة التركيب المتماثل من الإجراء مع ذلك الموصوف بالنسبة للخميرة وينتج مرة أخرى خلية تم فيها تعطيل الجين المستهدف. تكمن المشكلة في أننا لا نريد خلية واحدة متحولة فحسب ، بل نريد فأرًا متحورًا كاملًا ، لأنه فقط مع الكائن الحي الكامل يمكننا إجراء تقييم كامل لتأثير تعطيل الجين على النمط الظاهري. لتحقيق ذلك ، من الضروري استخدام نوع خاص من خلايا الماوس ، وهو جذع جنيني أو خلية ES (إيفانز وآخرون. ، 1997). على عكس معظم خلايا الفأر ، تكون الخلايا الجذعية الجنينية كاملة القدرة ، مما يعني أنها غير ملتزمة بمسار تنموي واحد ، وبالتالي يمكن أن تؤدي إلى ظهور جميع أنواع الخلايا المتمايزة. لذلك يتم حقن الخلية الجذعية الجنينية المهندسة في جنين الفأر ، والذي يستمر في التطور ويؤدي في النهاية إلى ظهور الوهم ، وهو فأر تكون خلاياه مزيجًا من الخلايا الطافرة ، المستمدة من الخلايا الجذعية الجنينية المهندسة ، والخلايا غير المتحولة ، المشتقة من جميع الخلايا الأخرى في الجنين. هذا ما زلنا غير ما نريده تمامًا ، لذلك يُسمح للفئران الكيميرية بالتزاوج مع بعضها البعض. ينتج بعض النسل عن اندماج اثنين من الأمشاج الطافرة ، وبالتالي سيكون غير خيمري ، حيث ستحمل كل واحدة من خلاياها الجين المعطل. وهذه هي الفئران بالضربة القاضية، ومع الحظ ، ستوفر أنماطهم الظاهرية المعلومات المرغوبة عن وظيفة الجين قيد الدراسة. يعمل هذا بشكل جيد مع العديد من عمليات تعطيل الجينات ولكن بعضها مميت وبالتالي لا يمكن دراسته في فأر متماثل الزيجوت بالضربة القاضية. وبدلاً من ذلك ، يتم الحصول على فأر متغاير الزيجوت ، وهو نتاج اندماج بين مشيج طبيعي وآخر متحور ، على أمل أن يكون التأثير الظاهري لتعطيل الجين واضحًا على الرغم من أن الفأر لا يزال لديه نسخة واحدة صحيحة من الجين قيد الدراسة.

تعطيل الجينات دون إعادة التركيب المتماثل

إعادة التركيب المتماثل ليست الطريقة الوحيدة لتعطيل الجين من أجل دراسة وظيفته. أحد البدائل هو استخدام علامات الترانسبوزون ، حيث يتم التعطيل عن طريق إدخال عنصر قابل للتحويل في الجين. تحتوي معظم الجينومات على عناصر قابلة للنقل (القسم 2.4.2) وعلى الرغم من أن الجزء الأكبر منها غير نشط ، إلا أن هناك عددًا قليلاً منها يحتفظ بقدرته على التحويل. في ظل الظروف العادية ، يعد التحويل حدثًا نادرًا نسبيًا ، ولكن من الممكن في بعض الأحيان استخدام تقنيات الحمض النووي المؤتلف لعمل الينقولات المعدلة التي تغير موقعها استجابةً لمحفز خارجي. طريقة واحدة للقيام بذلك ، تشمل الخميرة retrotransposon Ty1، هو مبين في الشكل 7.15.

الشكل 7.15

الحث الاصطناعي للتبديل. تم استخدام تقنيات الحمض النووي المؤتلف لوضع تسلسل محفز (القسم 3.2.2) يستجيب للجالاكتوز المنبع من a Ty1 عنصر في جينوم الخميرة. عندما يغيب الجالاكتوز ، فإن Ty1 العنصر ليس (أكثر.)

يعد وضع علامات على الينقولات أمرًا أساسيًا في التقنية التي تسمى البصمة الجينية (سميث وآخرون. ، 1995) ، والذي تم استخدامه لتعطيل العديد من أيتام الخميرة كخطوة أولى لتقييم وظيفتهم. يعد وضع علامات الينقولات مهمًا أيضًا في تحليل جينوم ذبابة الفاكهة ، باستخدام الجينوم الداخلي ذبابة الفاكهة يسمى الينقولات ص العنصر (إنجلز ، 2000). الضعف في وضع علامات الينقولات هو أنه من الصعب استهداف الجينات الفردية ، لأن التحويل هو حدث عشوائي إلى حد ما ومن المستحيل التنبؤ بالمكان الذي سينتهي به الينقول بعد قفزه. إذا كانت النية هي تعطيل جين معين ، فمن الضروري تحفيز عدد كبير من عمليات النقل ثم فحص الكائنات الحية الناتجة للعثور على واحد مع الإدخال الصحيح. لذلك فإن ترانسبوسون هو أكثر قابلية للتطبيق على الدراسات العالمية لوظيفة الجينوم ، حيث يتم تعطيل الجينات بشكل عشوائي ومجموعات الجينات ذات الوظائف المماثلة التي تم تحديدها من خلال فحص السلالة من أجل تغييرات النمط الظاهري المثيرة للاهتمام.

يتم توفير نهج مختلف تمامًا لتعطيل الجينات عن طريق تداخل الحمض النووي الريبي. في هذه التقنية ، بدلاً من تعطيل الجين نفسه ، يتم تدمير mRNA الخاص به. يتم تحقيق ذلك عن طريق إدخال جزيئات RNA قصيرة مزدوجة الشريطة في الخلية والتي تطابق تسلسلها تسلسل الحمض النووي الريبي المستهدف. يتم تقسيم الحمض النووي الريبي مزدوج الشريطة إلى جزيئات أقصر مما يؤدي إلى تحلل الرنا المرسال (الشكل 7.16). ثبت أن هذه العملية تعمل بشكل فعال في الدودة أنواع معينة انيقة (إطلاق النار وآخرون. ، 1998) ، الذي تم تسلسل جينومه بالكامل (انظر الجدول 2.1) والذي يُنظر إليه على أنه كائن نموذجي مهم لحقيقيات النوى الأعلى (القسم 12.3.2). ما يقرب من 2500 من أصل 2769 جينًا متوقعًا على الكروموسوم الأول من ج. elegans بشكل فردي عن طريق تداخل RNA ، وذلك ببساطة عن طريق وضع الديدان في محلول يحتوي على RNA مزدوج الشريطة والسماح لعمليات الامتصاص العادية بنقل الجزيئات إلى الخلايا (Fraser وآخرون، 2000). يتم توجيه مشاريع مماثلة نحو الآخر ج. ايليجانس الكروموسومات.

الشكل 7.16

تدخل الحمض النووي الريبي. يتم تقسيم جزيء الحمض النووي الريبي مزدوج الشريطة بواسطة ريبونوكلياز Dicer إلى & # x02018 قصيرة التداخل RNAs & # x02019 (siRNAs) بطول 21 & # x0201325 bp. خيط واحد من كل أزواج قاعدة siRNA إلى mRNA الهدف ، والذي يتحلل بعد ذلك (أكثر.)

من المعروف أن تداخل الحمض النووي الريبي يحدث بشكل طبيعي في مجموعة من حقيقيات النوى ، ولكن كان من المتوقع أن يكون تطبيقه على خلايا الثدييات أمرًا صعبًا لأن هذه الكائنات الحية تعرض استجابة موازية للحمض النووي الريبي مزدوج الشريطة ، حيث يتم منع تخليق البروتين بشكل عام ، مما يؤدي إلى موت الخلايا ( باس ، 2001). ومع ذلك ، لم يكن لهذه المخاوف أساس من الصحة ، لأنه ثبت الآن أن إدخال RNAs مزدوج الشريطة في الخلايا البشرية المستزرعة عن طريق الاندماج مع الجسيمات الشحمية (الشكل 7.17) يؤدي إلى تعطيل mRNA المستهدف ، مع عدم وجود انخفاض ملموس في تخليق البروتين الكلي (Elbashir وآخرون، 2001). العيب في استخدام هذه التقنية مع الثدييات هو أنه من الممكن فقط العمل مع خلايا مفردة ، بدلاً من الكائنات الحية الكاملة ، لأن RNAs مزدوجة الشريطة لها عمر محدود داخل الخلية ولا يمكن استخدامها لهندسة تغييرات دائمة مثل تلك الضرورية في بناء الفئران بالضربة القاضية.

الشكل 7.17

يمكن استخدام الاندماج مع الجسيمات الشحمية لتوصيل RNA مزدوج الشريطة إلى خلية بشرية.

يمكن أيضًا استخدام التعبير الجيني المفرط لتقييم الوظيفة

لقد ركزنا حتى الآن على التقنيات التي تؤدي إلى تعطيل الجين قيد الدراسة (& # x02018 فقدان الوظيفة & # x02019). تتمثل الطريقة التكميلية في هندسة كائن حي يكون فيه جين الاختبار أكثر نشاطًا من الطبيعي (& # x02018 اكتساب الوظيفة & # x02019) وتحديد التغييرات ، إن وجدت ، على النمط الظاهري. يجب التعامل مع نتائج هذه التجارب بحذر بسبب الحاجة إلى التمييز بين تغيير النمط الظاهري الذي يرجع إلى الوظيفة المحددة لجين مفرط التعبير ، وتغيير أقل تحديدًا في النمط الظاهري يعكس حالة غير طبيعية في الحالة التي يكون فيها منتج جيني واحد يتم تصنيعه بكميات زائدة ، ربما في الأنسجة التي يكون الجين فيها عادة غير نشط. على الرغم من هذا المؤهل ، فقد قدم الإفراط في التعبير بعض المعلومات المهمة عن وظيفة الجينات.

للإفراط في التعبير عن الجين ، يجب استخدام نوع خاص من ناقلات الاستنساخ ، نوع مصمم للتأكد من أن الجين المستنسخ يوجه تخليق أكبر قدر ممكن من البروتين. وبالتالي ، يكون المتجه متعدد النسخ ، مما يعني أنه يتكاثر داخل الكائن الحي المضيف إلى 40 & # x02013200 نسخة لكل خلية ، لذلك هناك العديد من النسخ من جين الاختبار. يجب أن يحتوي الناقل أيضًا على محفز نشط للغاية (القسم 9.2.2) بحيث يتم تحويل كل نسخة من جين الاختبار إلى كميات كبيرة من mRNA ، مما يضمن مرة أخرى إنتاج أكبر قدر ممكن من البروتين. يظهر مثال على التقنية المستخدمة مع جينات الفئران في الشكل 7.18 (Simonet وآخرون. ، 1997). في هذا المشروع ، تم اختيار الجينات المراد دراستها لأن تسلسلها يشير إلى أنها ترمز للبروتينات التي يتم إفرازها في مجرى الدم. احتوى ناقل الاستنساخ الذي تم استخدامه على محفز نشط للغاية يتم التعبير عنه فقط في الكبد ، لذلك قام كل فأر معدل وراثيا بإفراط في التعبير عن جين الاختبار في كبده ثم يفرز البروتين الناتج في الدم. تم فحص النمط الظاهري لكل فأر معدل وراثيا في البحث عن أدلة تتعلق بوظائف الجينات المستنسخة. تم اكتشاف اكتشاف مثير للاهتمام عندما تم إدراك أن أحد الفئران المعدلة وراثيًا لديه عظام أكثر كثافة من تلك الموجودة في الفئران العادية. كان هذا مهمًا لسببين: أولاً ، أنه مكّن من تحديد الجين ذي الصلة باعتباره واحدًا مشاركًا في تخليق العظام ، وثانيًا ، كان لاكتشاف البروتين الذي يزيد من كثافة العظام آثارًا على تطوير علاجات لهشاشة العظام البشرية ، وهي مرض هشاشة العظام. .

الشكل 7.18

التحليل الوظيفي عن طريق التعبير الجيني المفرط. الهدف هو تحديد ما إذا كان الإفراط في التعبير عن الجين قيد الدراسة له تأثير على النمط الظاهري لفأر معدّل وراثيًا. لذلك يتم إدخال (كدنا) للجين في ناقل استنساخ يحمل درجة عالية (أكثر).

المربع 7.1

تحليل الكروموسوم الأول من أنواع معينة انيقة عن طريق تدخل الحمض النووي الريبي. تم تعيين وظائف لـ 339 جينًا في C. ايليجانس الكروموسوم الأول بعد التعطيل الفردي بتقنية تدخل الحمض النووي الريبي. C. ايليجانس هي دودة خيطية صغيرة (انظر الشكل (المزيد).

7.2.3. دراسات أكثر تفصيلاً عن نشاط بروتين مشفر بواسطة جين غير معروف

يعد تعطيل الجينات والتعبير المفرط من الأساليب الأساسية التي يستخدمها باحثو الجينوم لتحديد وظيفة الجين الجديد ، ولكن هذه ليست الإجراءات الوحيدة التي يمكن أن توفر معلومات عن نشاط الجين. يمكن للطرق الأخرى توسيع وتفصيل نتائج التعطيل والإفراط في التعبير. يمكن استخدامها لتوفير معلومات إضافية من شأنها أن تساعد في تحديد وظيفة الجين ، أو قد تشكل أساسًا لفحص أكثر شمولاً لنشاط البروتين الذي تم بالفعل توصيف جينه.

يمكن استخدام الطفرات الموجهة لفحص وظيفة الجين بالتفصيل

يمكن أن يحدد التعطيل والإفراط في التعبير الوظيفة العامة للجين ، لكن لا يمكنهما تقديم معلومات مفصلة عن نشاط البروتين المشفر بواسطة الجين. على سبيل المثال ، قد يُشتبه في أن جزءًا من رموز جينية لتسلسل الأحماض الأمينية يوجه منتجها البروتيني إلى جزء معين في الخلية ، أو يكون مسؤولاً عن قدرة البروتين على الاستجابة لإشارة كيميائية أو فيزيائية. لاختبار هذه الفرضيات ، سيكون من الضروري حذف أو تغيير الجزء ذي الصلة من تسلسل الجينات ، ولكن ترك الجزء الأكبر دون تعديل بحيث يظل البروتين مُصنَّعًا ويحتفظ بالجزء الأكبر من نشاطه. الإجراءات المختلفة موقع موجه أو في المختبر الطفرات (الملاحظة الفنية 7.1) يمكن استخدامها لإجراء هذه التغييرات الطفيفة. هذه تقنيات مهمة لا تكمن تطبيقاتها في دراسة نشاط الجينات فحسب ، بل أيضًا في مجال هندسة البروتين ، حيث يتمثل الهدف في إنشاء بروتينات جديدة بخصائص أكثر ملاءمة للاستخدام في البيئات الصناعية أو السريرية.

المربع 7.1

الطفرات موقع الموجه. طرق لإجراء تغيير دقيق في تسلسل الجينات من أجل تغيير بنية البروتين وربما نشاطه. يمكن هندسة التغييرات في بنية البروتين من خلال تقنيات الطفرات الموجهة بالموقع ، والتي (المزيد)

بعد حدوث الطفرات ، يجب إدخال تسلسل الجين في الخلية المضيفة بحيث يمكن لإعادة التركيب المتماثل أن يحل محل النسخة الحالية من الجين بالنسخة المعدلة. يمثل هذا مشكلة لأنه يجب أن يكون لدينا طريقة لمعرفة الخلايا التي خضعت لإعادة التركيب المتماثل. حتى مع وجود الخميرة ، سيكون هذا جزءًا بسيطًا من الإجمالي ، وسيكون الجزء صغيرًا جدًا مع الفئران. عادةً ما نحل هذه المشكلة عن طريق وضع جين محدد (على سبيل المثال ، ترميز واحد لمقاومة المضادات الحيوية) بجوار الجين المتحور والبحث عن الخلايا التي تأخذ النمط الظاهري الذي تمنحه هذه العلامة. في معظم الحالات ، تقوم الخلايا التي تُدخل الجين الواسم في جينومها أيضًا بإدخال الجين المتحور المرتبط ارتباطًا وثيقًا وكذلك الخلايا التي نريدها. تكمن المشكلة في أنه في تجربة الطفرات الموجهة بالموقع ، يجب أن نتأكد من أن أي تغيير في نشاط الجين قيد الدراسة هو نتيجة طفرة معينة تم إدخالها في الجين ، وليس نتيجة غير مباشرة لتغيير بيئته في الجينوم عن طريق إدخال جين محدد بجانبه. الجواب هو استخدام استبدال الجين الأكثر تعقيدًا من خطوتين (الشكل 7.19). في هذا الإجراء ، يتم استبدال الجين المستهدف أولاً بجين العلامة بمفرده ، ويتم تحديد الخلايا التي يتم فيها إعادة التركيب عن طريق اختيار النمط الظاهري للجين الواسم. ثم يتم استخدام هذه الخلايا في المرحلة الثانية من استبدال الجين ، عندما يتم استبدال الجين الواسم بالجين المتحور ، تتم الآن مراقبة النجاح من خلال البحث عن الخلايا التي فقدت النمط الظاهري للجين الواسم. تحتوي هذه الخلايا على الجين المتحور ويمكن فحص أنماطها الظاهرية لتحديد تأثير الطفرة الموجهة على نشاط منتج البروتين.

الشكل 7.19

استبدال الجينات بخطوتين. انظر الى النص للحصول على التفاصيل.

يمكن استخدام جينات المراسل والكيمياء المناعية لتحديد مكان وزمن التعبير عن الجينات

غالبًا ما يمكن الحصول على أدلة على وظيفة الجين من خلال تحديد مكان ووقت نشاط الجين. إذا كان التعبير الجيني مقصورًا على عضو أو نسيج معين لكائن متعدد الخلايا ، أو على مجموعة واحدة من الخلايا داخل عضو أو نسيج ، فيمكن استخدام هذه المعلومات الموضعية لاستنتاج الدور العام للمنتج الجيني. وينطبق الشيء نفسه على المعلومات المتعلقة بالمرحلة التنموية التي يتم فيها التعبير عن الجين. أثبت هذا النوع من التحليل أنه مفيد بشكل خاص في فهم أنشطة الجينات المشاركة في المراحل الأولى من التطور في ذبابة الفاكهة (القسم 12.3.3) ويتم استخدامه بشكل متزايد لكشف علم الوراثة لتطور الثدييات. كما أنها قابلة للتطبيق على تلك الكائنات أحادية الخلية ، مثل الخميرة ، التي لها مراحل نمو مميزة في دورة حياتها.

يمكن تحديد نمط التعبير الجيني داخل الكائن الحي باستخدام الجين المراسل. هذا هو الجين الذي يمكن مراقبة تعبيره بطريقة ملائمة ، من الناحية المثالية عن طريق الفحص البصري (الجدول 7.1) ، تصبح الخلايا التي تعبر عن جين المراسل زرقاء ، أو تتألق أو تعطي بعض الإشارات المرئية الأخرى. لكي يعطي الجين المراسل إشارة موثوقة عن مكان وزمن التعبير عن جين الاختبار ، يجب أن يخضع المراسل لنفس الإشارات التنظيمية مثل جين الاختبار. يتم تحقيق ذلك عن طريق استبدال ORF لجين الاختبار بـ ORF للجين المراسل (الشكل 7.20). يتم احتواء معظم الإشارات التنظيمية التي تتحكم في التعبير الجيني في منطقة الحمض النووي المنبع من ORF ، لذلك يجب أن يعرض الجين المراسل الآن نفس نمط التعبير مثل جين الاختبار. وبالتالي يمكن تحديد نمط التعبير عن طريق فحص الكائن الحي بحثًا عن إشارة المراسل.

الجدول 7.1

أمثلة على جينات المراسل.

الشكل 7.20

جين مراسل. يحل إطار القراءة المفتوحة لجين المراسل محل إطار القراءة المفتوحة للجين قيد الدراسة. والنتيجة هي أن الجين المراسل يوضع تحت سيطرة التسلسلات التنظيمية التي عادة ما تملي نمط التعبير (المزيد).

بالإضافة إلى معرفة الخلايا التي يتم فيها التعبير عن الجين ، غالبًا ما يكون من المفيد تحديد موضع داخل الخلية حيث يوجد البروتين المشفر بواسطة الجين. على سبيل المثال ، يمكن الحصول على البيانات الأساسية المتعلقة بوظيفة الجين من خلال إظهار أن منتج البروتين يقع في الميتوكوندريا أو في النواة أو على سطح الخلية. لا يمكن لجينات المراسل أن تساعد هنا لأن تسلسل الحمض النووي المنبع للجين - التسلسل الذي يرتبط به الجين المراسل - لا يشارك في استهداف منتج البروتين إلى موقعه الصحيح داخل الخلايا. بدلاً من ذلك ، فإن تسلسل الأحماض الأمينية للبروتين نفسه هو المهم. لذلك فإن الطريقة الوحيدة لتحديد مكان البروتين هي البحث عنه مباشرة. يتم ذلك عن طريق الكيمياء الخلوية المناعية ، والتي تستخدم جسمًا مضادًا خاصًا بالبروتين المعني وبالتالي يرتبط بهذا البروتين وليس غيره. يتم تمييز الجسم المضاد بحيث يمكن تصور موضعه في الخلية ، ومن ثم موضع البروتين المستهدف (الشكل 7.21). تُستخدم العلامات الفلورية والفحص المجهري للضوء للدراسات منخفضة الدقة بدلاً من ذلك ، ويمكن إجراء الكيمياء الخلوية المناعية عالية الدقة عن طريق المجهر الإلكتروني باستخدام ملصق كثيف الإلكترون مثل الذهب الغروي.

الشكل 7.21

كيمياء الخلايا المناعية. يتم التعامل مع الخلية بجسم مضاد مُسمى بعلامة فلورسنت زرقاء. يظهر فحص الخلية أن إشارة الفلورسنت مرتبطة بغشاء الميتوكوندريا الداخلي. لذلك فإن فرضية العمل (المزيد)


إجراءات المختبر الرطب

أخذ عينات الأنسجة والحفاظ عليها

يجب تجنب تلف الحمض النووي. تم تقديم مثال للممارسات الجيدة لجمع الأنسجة وحفظها في Wong et al.، (2012).

استخراج الحمض النووي والنوعية والكمية

يتم تقييم جودة الحمض النووي باستخدام

0.8٪ -1٪ الاغاروز الكهربائي للهلام وسلم الوزن الجزيئي 25 كيلو بايت. نطاق وزن جزيئي واحد مرتفع (

23 Kbp) يشير إلى سلامة الحمض النووي الجيدة. تم تأكيد نقاء الحمض النووي العالي بنسبة امتصاص 260/280 نانومتر

1.8 - 2.0.يجب تجنب الحمض النووي شديد التجزئة لأنه لا يمكن قياسه بدقة باستخدام طرق قياس الفلورومتر (موصى بها لتقدير دقيق للحمض النووي مزدوج الشريطة) (Sedlackova ، Repiska ، Celec ، Szemes ، و Minarik ، 2013). بالنسبة لـ Pool-seq ، يعد هذا مهمًا بشكل خاص لأن المساهمة المتساوية للحمض النووي الفردي في مجموعة تعتمد على القياس الكمي الدقيق. يعتمد مقدار بدء تشغيل الحمض النووي على متطلبات إدخال مجموعات إعداد المكتبة الموضحة في الجدول 1.

توحيد تركيز الحمض النووي عبر العينات (لـ Pool-seq و lcWGR)

يتم تخفيف أو تركيز كل عينة DNA إلى القيمة القياسية المرغوبة (نانوغرام / ميكرولتر). يجب أن يعمل السائل المخفف على استقرار الحمض النووي وحمايته من التلف (على سبيل المثال ، منخفض الإنزيم المساعد). يوصى باستخدام روبوت مناولة السوائل لهذه الخطوة للقضاء على احتمال حدوث خطأ في الأنابيب (الشكل B2).

تجميع الحمض النووي (Pool-seq)

يتكون التجميع على خلط كميات متساوية من الحمض النووي للعديد من الأفراد من السكان. عندما يكون الاهتمام هو تحديد الأساس الجيني لخاصية ما ، يجب أن تضم التجمعات أفرادًا يتشاركون نفس السمة (ليس بالضرورة من نفس المجموعة السكانية) ، كما أن فئات السمات المتطرفة لديها إمكانية متزايدة لتؤدي إلى إشارات جينية أكثر وضوحًا. يوصى بـ 50 فردًا على الأقل لكل مجموعة ، ولكن تضمين المزيد (& gt100) (بافتراض زيادة تناسبية في عمق التسلسل) يمكن أن يساعد في تقليل التفاوت الطفيف في تمثيل عدد قليل من الأفراد مما يؤدي إلى تقديرات تردد أليل أكثر دقة (Gautier et al. ، 2013 Schlötterer وآخرون ، 2014). ثم يتم تخفيف الحمض النووي الفردي إلى تركيز معياري والتحقق منه من خلال خطوة القياس الكمي. بمجرد التطبيع ، يمكن تجميع نفس الكمية من الحمض النووي من العينات الفردية في أنبوب واحد.

إعداد مكتبة التسلسل

تتوفر عدة مجموعات لتحضير المكتبة تجارياً. وهي تختلف في التكلفة لكل عينة ، والحاجة إلى جهاز صوتي ، ودمج خطوة PCR وكمية إدخال الحمض النووي. لمعرفة السعر الحالي ومتطلبات إدخال الحمض النووي لمجموعات Illumina ، انظر الجدول 1. يعد تضخيم الحمض النووي باستخدام PCR مناسبًا عند توفر كميات منخفضة من الحمض النووي ، ولكن يمكن أن يؤدي تفاعل البوليميراز المتسلسل إلى حدوث تحيزات (على سبيل المثال ، التمثيل الناقص للشظايا الغنية بالـ GC ، والتضخيم التفضيلي للشظايا القصيرة والتكرارات) التي يمكن أن تؤدي إلى تغطية غير متساوية في بعض المواقع. يمكن التقليل من بعض هذه التحيزات عن طريق إجراء تعديلات على بروتوكول PCR (Aird et al. ، 2011) (على سبيل المثال ، استخدام أقل عدد ممكن من دورات PCR ، عادةً 6-8) وإزالة التكرارات في silico باستخدام أدوات Picard ، http: // broadinstitute.github.io/picard أو samtools (Li ، Handsaker ، وآخرون ، 2009). تم اكتشاف المتغيرات الهيكلية الصغيرة (INDELs و CNVs) من قراءات قصيرة للمكتبات القياسية (

350–550 bp حجم إدراج) ، في حين أن اكتشاف المتغيرات الهيكلية الكبيرة (التي تمتد ميجابت) قد يتطلب استخدام مكتبات زوجية (

حجم إدخال 2-20 كيلو بايت) أو بيانات طويلة القراءة. تمت مناقشة اعتبارات إضافية في Head et al. (2014).

تسلسل عالي الإنتاجية لمكتبات الحمض النووي

حاليًا ، تعد تقنية Illumina الأكثر شيوعًا لتسلسل القراءة القصيرة عالية الإنتاجية ، على الرغم من تطوير تقنيات جديدة (Goodwin et al. ، 2016). تقدم Illumina دقة شاملة تصل إلى 99.5٪ ، وهي نسبة عالية مقارنة بالمنصات الأخرى ولكنها لا تزال مقيدة حيث يصعب التمييز بين التباين الجيني الحقيقي من المصنوعات الفنية (Laehnemann ، Borkhardt ، & McHardy ، 2016). الحد الأدنى المقترح للتغطية huWGR هو & gt30 × / فرد (Sims ، Sudbery ، Ilott ، Heger ، & Ponting ، 2014) ، وبالنسبة لـ Pool-seq ، فهو & gt50 × / pool (Schlötterer et al. ، 2014) ، على الرغم من الكثير يجب استهداف التغطية الأعلى (& gt100-200 ×) للكشف عن الأليل النادر (Wang، Skoog، et al.، 2016) وبالنسبة لـ lcWGR يكون 1-4 × / فرد (Nielsen et al.، 2011 Buerkle & Gompert، 2013) . يعتمد عدد ممرات Illumina المطلوبة على المقايضة بين حجم الجينوم والتغطية المستهدفة لكل عينة / تجمع وإنتاجية خلية التدفق. من المحتمل أن يكون تسلسل Illumina عرضة للاختلاف من حارة إلى حارة (روس ، روس ، وكوستيلو ، 2013) ، وهي مشكلة يمكن التقليل منها عن طريق توزيع مكتبات مشفرة عبر مسارات متعددة (مرفق تسلسل TCAG DNA.

إجراءات الكمبيوتر

مراقبة جودة التسلسلات الأولية

قراءة الخرائط لجينوم مرجعي

يتم تعيين قراءات عالية الجودة للجينوم بناءً على تشابه التسلسل. توجد خوارزميات متعددة لرسم الخرائط قصيرة القراءة وتمت مراجعتها في مكان آخر (Fonseca، Rung، Brazma، & Marioni، 2012 Hatem، Bozdaǧ، & Çatalyürek، 2013 Reinert et al.، 2015 Ye، Meehan، Tong، & Hong، 2015). بعض أدوات التقويم المجانية الأكثر شيوعًا هي BWA (Li & Durbin 2009 ، 2010 Li ، 2013) (الجدول 2) و Bowtie2 (Langmead & Salzberg ، 2012). يمكن أن تنشأ مصنوعات المحاذاة بسبب عوامل متعددة ، بما في ذلك الاختلالات حول INDELs والاختلاف بين قراءات الموضوع والجينوم المرجعي. لذلك من المهم فهم كيفية عمل الخوارزميات المختلفة لاتخاذ قرارات مستنيرة حول كيفية تحسين معلمات التشغيل (انظر الإطار 3). المنتج النهائي لتعيين القراءة هو ملف SAM (محاذاة التسلسل / الخريطة) (عدة جيجابت في الحجم) ، وهو تنسيق يحتوي على سطر لكل قراءة وحقول مع المعلومات المرتبطة بما في ذلك موضع القراءة ودرجة جودة التعيين (MAPQ أو MQ) (Li ، Ruan، & Durbin، 2008) التي يمكن استخدامها لتصفية SNP. يتم الحصول على ملف BAM ، الإصدار الثنائي المضغوط خفيف الوزن من ملف SAM ، باستخدام أدوات Picard ، وهو التنسيق المفضل عمومًا كملف إدخال بواسطة البرامج الأخرى. تعد قراءة الفرز ووضع علامات على التكرارات وإضافة مجموعات القراءة والفهرسة خطوات إضافية لإعداد ملفات BAM لاستدعاء المتغير (Van der Auwera et al. ، 2013).

مراقبة جودة القراءات المعينة

إعادة تنظيم Indel (اختياري ، اعتمادًا على متصل SNP)

قد لا يتم حل أخطاء الخرائط الدقيقة حول INDELs عن طريق تحسين معلمات التعيين العالمية. تعد عمليات إعادة تنظيم INDEL المحلية شرطًا أساسيًا ضروريًا عند استخدام خوارزمية استدعاء SNP قائمة على الموقع مثل samtools (Li ، Handsaker ، وآخرون ، 2009) أو gatk - unifiedgenotyper (McKenna et al. ، 2010). هذه الخطوة غير ضرورية عند استخدام المتصلين على أساس النمط الفرداني مثل freebayes (Garrison & Marth ، 2012) أو gatk - haplotypecaller (http://gatkforums.broadinstitute.org/gatk/discussion/7847). يمكن إجراء إعادة تنظيم INDEL بوظائف محددة في gatk (McKenna et al. ، 2010) (البرنامج التعليمي: https://software.broadinstitute.org/gatk/guide/article؟id=7156). يمكن أن يساعد ملف مع INDELs المعروفة في تحديد أهداف لإعادة التنظيم (Van der Auwera et al. ، 2013) ، ولكن في حالة عدم وجودها ، يمكن استخدام INDELs المحددة أثناء رسم الخرائط بدلاً من ذلك (الوضع الافتراضي) (https://software.broadinstitute.org /gatk/events/slides/1504/GATKwr7-X-3-Non_human.pdf).

إعادة المعايرة الأساسية (اختياري لكن موصى به)

غالبًا ما تقدم درجات الجودة لكل قاعدة التي تم الحصول عليها من أجهزة التسلسل أخطاءً. نظرًا لأن خوارزميات احتمال استدعاء SNP والنمط الجيني تأخذ في الاعتبار نقاط الجودة هذه ، فيجب تصحيحها. يمكن تحقيق ذلك باستخدام حزمة إعادة معايرة نقاط الجودة الأساسية (BQSR) المنفذة في gatk (DePristo et al.، 2011 Van der Auwera et al.، 2013). مطلوب مجموعة معروفة من المتغيرات ، ولكن في حالة عدم وجودها ، يمكن اتباع نهج تكراري للتمهيد بدلاً من ذلك (Tung، Zhou، Alberts، Stephens، & Gilad، 2015 Snyder-Mackler et al.، 2016).

الكشف عن المواقع المتغيرة

توجد برامج محددة للكشف عن أنواع مختلفة من المتغيرات الجينية (مثل SNPs و INDELs و SVs و CNVs). تنفذ هذه الخوارزميات نماذج معينة من التباين ومصادر المعلومات لاكتشاف الأشكال المتعددة من البيانات قصيرة القراءة. يتم اكتشاف المواضع المتغيرة بشكل مختلف في بيانات hrWGR و huWGR و Pool-seq و lcWGR. في الثلاثة الأولى ، يعتمد اكتشاف الموقع متعدد الأشكال على تغطية وجودة القراءة لكل موقع لكل فرد أو مجموعة ، بينما في الأخير ، يعتمد على تغطية وجودة جميع القراءات التي تغطي موقعًا من عدة أفراد في عينة معينة. لا يتم استدعاء SNPs في lcWGR ، بدلاً من ذلك ، يتم حساب احتمالات النمط الجيني لكل موقع باستخدام برنامج مثل angsd (Korneliussen et al. ، 2014). في hrWGR و huWGR و Pool-seq ، تُسمى SNPs باستخدام برنامج مثل gatk - haplotypecaller أو samtools أو freebayes (الجدول 2). يمكن العثور على مراجعة شاملة لاتصالات SNP باستخدام بيانات NGS في Nielsen et al. (2011) و (2012) ، والمتغيرات الهيكلية في Alkan et al. (2011). تضع كل خوارزمية استدعاء SNP سلسلة من الافتراضات التي يمكن أن تؤدي إلى نتائج مختلفة. وبالتالي ، فإن الممارسة الجيدة هي مقارنة SNPs المكتشفة بواسطة خوارزميتين على الأقل (O'Rawe et al. ، 2013). منتج الاتصال المتغير هو ملف VCF (تنسيق نداء متغير) يحتوي على تعدد الأشكال الخام والشروح (Danecek et al. ، 2011).

يتطلب اختيار خوارزمية استدعاء SNP لبيانات Pool-seq النظر في ما إذا كانت تتعامل مع كتل أكبر من 2. نظريًا ، تجمع بلاوي = Ploidy لكل فرد × عدد الأفراد. بافتراض أن 50 فردًا ثنائي الصيغة الصبغية مختلطون ، فإن ploidy التجمع هو 100. ومع ذلك ، فإن مثل هذه الأحجام الكبيرة تستنفد ذاكرة النظام وتضاعف وقت التشغيل (في gatk - haplotypecaller https://software.broadinstitute.org/gatk/gatkdocs/org_broadinstitute_gatk_tools_walkers_haplotypecaller و free. : //github.com/ekg/freebayes/commit/576bc703c246035342538a0feeecd1 ، تم الدخول إليه في يونيو 2017).

يؤدي استخدام ploidy الافتراضي (2) إلى استدعاء البرنامج للأليلين الأكثر شيوعًا في التجمع ، حيث يفترض ploidy تردد أليل 50/50 (http://gatkforums.broadinstitute.org/gatk/discussion/6551/what-if -ploidy-is-set-to-2-for-pooled-dna-sequencing-experience ، تم الوصول إليه في يونيو 2017). قد لا تكون هذه مشكلة عند استدعاء SNPs بين العينات وثيقة الصلة حيث تعتبر SNPs biallelic ، ولكنها ستحد من العدد الإجمالي للأليلات المكتشفة عند مقارنة العينات ذات الصلة البعيدة. يتم الآن حل استخدام الجسيمات الكبيرة جزئيًا عن طريق تحديد الحد الأقصى لعدد الأليلات البديلة التي يجب أخذها في الاعتبار. في gatk v.3.7 يمكن تعيين هذا مع العلم –maxGenotypeCnt (https://software.broadinstitute.org/gatk/blog؟id=8692) ، وفي FreeBayes مع –استخدام- أفضل- n- الأليلات وتعيين وضع مجمّع (- مجمعة منفصلة أو - مشترك - مستمر). تجعل هذه الإعدادات الخوارزميات تعمل بشكل أسرع على حساب الأليلات منخفضة التردد المفقودة في المواقع متعددة الأليلات (https://github.com/ekg/freebayes).

مراقبة جودة المتغيرات الخام

يجب إزالة SNPs ذات الدعم المنخفض من مجموعة البيانات النهائية حيث من المرجح أن تكون مكالمات كاذبة. يمكن تحقيق ذلك إما باستخدام إعادة معايرة نقاط الجودة المتغيرة (VQSR) أو تطبيق المرشحات الصلبة. يُفضل VQSR عمومًا لأنه ترشيح غير متحيز يعتمد على عدد كبير من المتغيرات التي تم التحقق من صحتها والتي تدرب الخوارزمية (Van der Auwera et al. ، 2013). عادةً ما يتم تطبيق المرشحات الصلبة في حالة عدم وجود متغيرات معروفة وتتضمن إزالة SNPs بناءً على معلمات التعليق التوضيحي المعينة لكل SNP أثناء رسم الخرائط والاستدعاء المتغير. تشتمل المرشحات الشائعة على تعقيد منخفض ، وأقصى عمق ، وتوازن أليل ، وخيط مزدوج ، وخيط فيشر ، وفلتر جودة (Van der Auwera et al.، 2013 Li & Wren، 2014) ، بالإضافة إلى جودة الخرائط (MQ) (Li et al. ، 2008). تحسب كل خوارزمية تعيين درجة MQ بشكل مختلف (Ruffalo و Koyutürk و Ray و LaFramboise ، 2012) والتي لا ينبغي مقارنة النتائج بين البرامج. ومع ذلك ، يمكن أن يؤدي تطبيق المرشحات الصلبة إلى تحيز طيف تردد الموقع من خلال استبعاد المتغيرات منخفضة التردد ويقتصر على عدم وجود إرشادات لتحديد التعليقات التوضيحية أو القيم النهائية التي يجب تطبيقها على بيانات معينة. الاختيار المناسب لقيم القطع هو دالة للبيانات. وبالتالي ، فإن التوصية هي اختبار مجموعات وعتبات مختلفة للمعلمات لتحسين هذه المرشحات. هذا المنتدى ، https://software.broadinstitute.org/gatk/guide/article؟id=6925 ، يمكن أن يقدم بعض الأفكار حول التصفية الصعبة باستخدام gatk. بالإضافة إلى ذلك ، يجب إزالة SNPs داخل المناطق منخفضة التعقيد لأن هذه المناطق مزعجة لتخطيط القراءة واستدعاء SNP (Li & Wren ، 2014). يصبح ملف VCF النهائي بعد مراقبة الجودة جاهزًا للتحليلات النهائية.

تعليق توضيحي متغير

يمكن إضافة تعليقات توضيحية لمصطلحات علم الوجود التسلسلي إلى المتغيرات في ملف VCF باستخدام على سبيل المثال ، برامج vcfanno (Pedersen et al. ، 2016) أو annovar (Yang & Wang ، 2015) أو snpeff (Cingolani et al. ، 2012).

التحقق من صحة المتغير

يجب التعامل مع المتغيرات المكتشفة من بيانات WGR على أنها تعدد أشكال مفترض ، خاصة في Pool-seq و lcWGR. يمكن استخدام الأساليب القائمة على التنميط الجيني للـ SNP للتحقق من صحة SNP. يمكن استخدام تضخيم PCR وتسلسل Sanger للتحقق من صحة SVs.

للحصول على إرشادات إضافية حول كيفية الحصول على متغيرات عالية الجودة من بيانات التسلسل عالي الإنتاجية ، راجع Van der Auwera et al. (2013) و Pfeifer (2017).

الإطار 3: تسلسل المجموعة: القيود ومصادر الخطأ والتحيز والحلول المحتملة


صفحة أبحاث أعضاء هيئة التدريس

يدرس مختبري كيف تتطور التسلسلات الجينومية التي تتحكم في وظيفة التعبير الجيني. نحن مدفوعون بالرغبة في فهم الأساس الجزيئي للتنوع العضوي ، والاعتقاد بأن العديد من الاختلافات في علم وظائف الأعضاء والتشكل والسلوك تنشأ من التغييرات في تنظيم الجينات. هدفنا النهائي هو أن نكون قادرين على تفسير المعلومات التنظيمية المشفرة في الحمض النووي الجيني ، حتى نتمكن بشكل روتيني من تحديد التسلسلات التنظيمية ، وتمييز وظيفتها ، والتنبؤ بعواقب اضطرابها ، وإعادة بناء كيفية تطورها.

نحن مختبر حسابي وتجريبي هجين يجمع بين التحليل الحسابي والتجريبي على نطاق الجينوم لتنظيم الجينات في ذبابة الفاكهة سوداء البطن و خميرة الخميرة مع تحليل شامل لبيانات التسلسل المقارن والتحليل التجريبي للأنواع المرتبطة ارتباطًا وثيقًا بأنظمة النموذج هذه. نحن نركز على نطاقات زمنية تطورية قصيرة حيث من الممكن الجمع بين تغييرات محددة في تسلسل الجينوم مع تعديلات في تنظيم الجينات والتعبير عنها.

المشاريع الحالية

التوصيف التجريبي لتنظيم الجينات في D. melanogaster الأجنة

لتوفير أساس تجريبي قوي لدراساتنا التطورية ، نحن نعمل مع العديد من المعامل الأخرى في بيركلي لتشريح التعبير الجيني والتنظيم بشكل منهجي في وقت مبكر D. melanogaster الجنين. لكل من عوامل النسخ الأربعين تقريبًا الحاسمة في تشكيل الأنماط الأمامية والخلفية والظهرية والبطنية ، تتمثل أهدافنا في: 1) قياس تقارب العوامل في المختبر لكل من تسلسلها المستهدف المحتمل ، 2) تحديد المناطق الجينومية المرتبطة حسب كل عامل في الأجنة الحية ، 3) تحديد نمط التعبير عن العامل وأهدافه في ثلاثة أبعاد بدقة خلوية. أنا وأعضاء مختبري نشارك بنشاط في الأجزاء التجريبية للمشروع ونقوم بتحليل هذه البيانات.

نمذجة القيود التطورية على التسلسلات التنظيمية حقيقية النواة

لدينا الآن بيانات تسلسل مقارن مكثفة لفراشات الفاكهة (12 جينوم ذبابة الفاكهة) والخمائر (العديد من الجينومات الفطرية) ، ونستخدم هذه البيانات لتوصيف كيف لبنات البناء الفردية للتسلسلات التنظيمية (مواقع ربط عامل النسخ) والهياكل عالية الرتبة (على سبيل المثال التنموية. معززات) تتطور. نحن مهتمون بشكل خاص بفهم كيفية تأثير الاختيار للحفاظ على مواقع ربط عامل النسخ على تطور التسلسلات المستهدفة ، وكيف ترتبط المرونة الشاملة التي تظهر في تنظيم معززات النمو بوظيفتها.

توصيف ونمذجة اختلاف شبكة النسخ داخل وبين أنواع ذبابة الفاكهة

يطبق مختبري أساليب التصوير الفلوري عالية الدقة التي تم تطويرها من أجلها D. melanogaster لتحليل التعبير الجيني بشكل منهجي ، وتشريح الشبكات التنظيمية ، في أخرى ذبابة الفاكهة الأنواع وفي العديد من السلالات الفطرية D. melanogaster. البيانات التجريبية التفصيلية التي ننتجها D. melanogaster، وتسلسل الجينوم لـ 12 نوعًا من ذبابة الفاكهة هي مورد هائل لدراسة تطور تنظيم الجينات. ومع ذلك ، من الصعب دراسة التغييرات في التسلسل دون فهم السياق الذي توجد فيه هذه التسلسلات وكيف تؤثر هذه التغييرات على الوظيفة. في حين أنه من غير العملي تكرار كل تجربة يتم إجراؤها في D. melanogaster في كل سلالة وأنواع أخرى ، نقوم بتوسيع عدة فئات من التجارب لتشمل سلالات وأنواعًا مختارة حتى نتمكن من فهم التباين التنظيمي بشكل أفضل في كل من مستوياته المتعددة: كيف يؤثر اختلاف التسلسل على الارتباط ، وكيف يؤثر اختلاف الربط على التعبير ، وكيف يختلف التعبير يؤثر على النمط الظاهري.

استخدام تطور التسلسل التنظيمي لتوضيح آليات تنظيم الجينات

للاستفادة من تنوع التسلسل خارج جنس ذبابة الفاكهة ، نقوم بترتيب المواقع المهمة من الناحية التنموية من عدة عائلات ذبابة غير ذبابة الفاكهة لتوفير رؤى حول المبادئ الأساسية لتنظيم الجينات. نحن مهتمون بشكل خاص بالتسلسلات التنظيمية التي خضعت لعمليات إعادة ترتيب واسعة النطاق في ذخيرة مواقع الربط الخاصة بها دون تغيير وظيفتها. على الرغم من ملاحظة عمليات إعادة ترتيب واسعة النطاق بين التسلسلات التنظيمية ذبابة الفاكهة ، يجب أن تكون هناك حدود لهذه اللدونة. بمرور الوقت ، سوف تتراكم التسلسلات التنظيمية فقط تلك التغييرات في ذخيرة مواقع الربط الخاصة بها والتي تتوافق مع الأحداث الكيميائية الحيوية المعقدة المطلوبة لإنتاج مخرجاتها التنظيمية المحددة. لذلك نعتقد أن جمع وتوصيف التسلسلات التنظيمية ذات الوظائف المتشابهة ولكن التسلسلات المتنوعة سيؤدي في النهاية إلى فهم أفضل لمبادئ الكيمياء الحيوية التي تربط تكوين وتنظيم التسلسلات التنظيمية بوظيفتها. لإجراء مثل هذا التحليل ، نقوم حاليًا بتسلسل 20 موقعًا مستهدفًا من 6 أنواع في كل من عائلات Sepsidae (ذباب الراية) و Tephritidae (ذباب الفاكهة الحقيقي) و Diopsidae (ذباب ساق العين). اخترنا هذه الأصناف ، التي تباعدت عن ذبابة الفاكهة بين 100 و 150 مليون سنة ، لتوفير التوازن الأمثل بين اختلاف التسلسل والاختلاف الوظيفي. نحن نكمل تحليل التسلسل بالتحليل التجريبي للتطور في الأنواع المختارة من كل تصنيف ، ودراسة نشاط المعززات من هذه الأنواع في D. melanogaster الأجنة ، والاختبار المكثف للفرضيات المتعلقة بوظيفة التسلسل التنظيمي والتطور.

منشورات مختارة

[نسخ من جميع الأوراق متوفرة في rana.lbl.gov]

بولارد دا ، موسى آم ، آير في إن وآيزن إم بي (2006). انتشار الخلاف بين أشجار الجينات وشجرة الأنواع في ذبابة الفاكهة: دليل على عدم اكتمال فرز النسب. علم الوراثة PLoS 2(10): e173.

موسى AM ، بولارد DA ، Nix DA ، Iyer VN ، Li XY ، Biggin MD ، Eisen MB (2006). معدل دوران واسع النطاق لمواقع ربط عامل النسخ الوظيفي في ذبابة الفاكهة. PLoS علم الأحياء الحسابي 2(10): e130.

بولارد DA ، موسى AM ، Iyer VN و Eisen MB. الكشف عن حدود الحفاظ على العناصر التنظيمية وتقدير الاختلاف باستخدام محاذاة متعددة زوجية ومتعددة. المعلوماتية الحيوية BMC 7(1):376.

شيانغ دي واي ، نيكس دا ، شولتزابيرجر آر كيه ، جاسش إيه بي ، آيزن إم بي (2006).متطلبات بنية المروج المرنة لتوظيف المحفز. علم الأحياء الجزيئي BMC 7(1):16.

Gasch AP و Moses AM و Chiang DY و Fraser HB و Berardini M و Eisen MB (2004). حفظ وتطور رابطة الدول المستقلة- نظم التنظيم في الفطريات Ascomycete. بلوس علم الأحياء 2(12): إي 398.

Moses AM و Chiang DY و Pollard DA و Iyer VN و Eisen MB (2004). MONKEY: تحديد مواقع ربط عامل النسخ المحفوظة في محاذاة متعددة باستخدام نموذج تطوري ملزم خاص بالموقع. بيولوجيا الجينوم 5(12): R98.

Berman BP و Pfeiffer BD و Laverty TR و Salzberg SL و Rubin GM و Eisen MB و Celniker SE (2004). التحديد الحسابي للمعززات التنموية: حفظ ووظيفة مجموعات مواقع ربط عامل النسخ في ذبابة الفاكهة سوداء البطن و ذبابة الفاكهة الزائفة. بيولوجيا الجينوم 5(9): R61.

Moses AM و Chiang DY و Kellis M و Lander ES و Eisen MB (2003). ضع تباينًا محددًا في معدل التطور في مواقع ربط عامل النسخ علم الأحياء التطوري BMC 3(19).

Berman BP و Nubu Y و Pfeiffer BD و Tomancak P و Celniker SE و Levine M و Rubin GM و Eisen MB (2002). استغلال مجموعات موقع ارتباط عامل النسخ للتعرف عليها رابطة الدول المستقلة- الوحدات التنظيمية المشاركة في تشكيل الأنماط في ذبابة الفاكهة الجينوم. بروك ناتل أكاد علوم الولايات المتحدة الأمريكية 99, 757-62.


ملفات بيانات إضافية

تتوفر ملفات البيانات الإضافية التالية. ملف بيانات إضافي 1: الأنسجة التي تم تحليلها في هذه الدراسة. الأنسجة في الجزء العلوي ، المميزة بالألوان ، هي تلك التي تعتبر من بين أنواع الأنسجة العشرة الشائعة. تم الجمع بين أولئك الذين لديهم تلوين متطابق (عن طريق حساب متوسط ​​الشدة الطبيعية) لتحليل حفظ التعبير الجيني بين الأنسجة العشرة الشائعة. ملف بيانات إضافي 2: بيانات التعبير الجيني Microarray التي تم الحصول عليها في هذه الدراسة. تُظهر المجموعات العنقودية مجموعات بيانات ميكروأري في الدجاج والضفدع وسمك السمكة المنتفخة ، معروضة كنسبة تعبير نسبي (انظر المواد والطرق) لكل جين داخل كل من الأنسجة العشرين التي تم تحديدها. تم ترتيب الصفوف والأعمدة بشكل مستقل لكل مجموعة بيانات ، وتم كسر الفروع عالية المستوى وإعادة ترتيبها للحصول على مظهر قطري كما هو موضح في [44]. ملف بيانات إضافي 3: Dendrogram للارتباطات بين عشرة أنسجة مشتركة ، باستخدام 1 - ارتباط بيرسون ومتوسط ​​ارتباط أكثر من 3074 جينًا. ملف بيانات إضافي 4: فئات الأنطولوجيا الجينية التي تميل إلى التعبير عنها بدرجة عالية في كل من الأنسجة العشرة الشائعة. يتم عرض فئات العمليات البيولوجية المحددة GO المخصبة بين الجينات التي يتم التعبير عنها بشكل كبير داخل كل من الأنسجة العشرة المشتركة في كل نوع. تم ترتيب ترتيب فئة الأنسجة و GO يدويًا في خريطة الحرارة. (توجد مصفوفة كاملة من درجات WMW في ملف بيانات إضافي 13.) ملف بيانات إضافي 5: مصفوفة ثنائية للجينات المصنفة على أنها تحتوي على أحداث تعبير محفوظة بالكامل ، بناءً على كثافة بقعة ميكروأري المرتبة ، في خمسة عتبات مختلفة (1/6 ، 1 / 5 ، 1/4 ، 1/3 ، 1/2). ملف بيانات إضافي 6: توزيعات تراكمية تلخص المقارنات الزوجية لحفظ التعبير الجيني باستخدام مقياس ارتباط بيرسون. توضح التوزيعات التراكمية نسبة جميع الجينات مع بيرسون البالغ عددها 3074 ص (شدة طبيعية) أقل من القيمة الموضحة على المحور الأفقي ، لأخصائيي تقويم العظام الحقيقيين (الأخضر) والجينات المتطابقة عشوائيًا (الأزرق). ملف بيانات إضافي 7: مصفوفة الميزات المستخدمة لمقارنة حفظ تدابير التعبير بالسمات الأخرى للجينات الفردية ، مع ارتباطات سبيرمان و ص-القيم. ملف بيانات إضافي 8: WMW ص- قيم الصفات الجينية الفئوية ، مع تحديد الرتب من خلال الحفظ النسبي للتعبير الجيني عن طريق ارتباط بيرسون الوسيط لكل نوع مقابل تتراودون. ملف بيانات إضافي 9: التوزيع التراكمي لدرجات EEL لتقويم العظام الحقيقي والمتناوب بين الإنسان وسمك السمكة المنتفخة. ملف بيانات إضافي 10: تحليل نسبة جميع الجينات في كل نوع والتي يتم التعبير عنها داخل كل نسيج. ملف بيانات إضافي 11: قائمة الجينات المصنفة على أنها TFs على أساس احتوائها على مجال ربط DNA معروف. ملف بيانات إضافي 12: المجموعات العنقودية التي تبين ارتباطات سبيرمان و ص- قيم مقارنات حفظ التعبير الجيني مقابل خصائص الجينات الأخرى. ملف بيانات إضافي 13: إثراء WMW ص- قيم الجينات المرتبطة بشروح عملية GO البيولوجية المعبر عنها داخل كل نسيج من كل نوع (المصفوفة الكاملة المستخدمة لإنشاء ملف بيانات إضافي 4).


الملخص

تُظهر الأنواع التي تم تقييمها على أنها مهددة من قبل الاتحاد الدولي لحفظ الطبيعة (IUCN) دليلاً على انخفاض أحجام السكان. يُفقد التنوع الجيني بسبب هذا التدهور ، مما يقلل من القدرة التكيفية للأنواع ويزيد من خطر الانقراض في بيئة متغيرة. في هذه الدراسة ، قمنا بجمع مجموعة بيانات واسعة من تنوع النيوكليوتيدات في جين الميتوكوندريا COI (الوحدة الفرعية Cytochrome C Oxidase I) لـ 4363 نوعًا حيوانيًا تم تقييمها بواسطة IUCN ووجدنا انخفاضًا كبيرًا في مستويات التنوع في الأنواع المهددة من فئات الحيوانات طويلة العمر. بعد ذلك ، قمنا ببناء إطار مقارن من خلال الحصول على فاصل الثقة 95 ٪ (CI) للقيم المتوسطة لتنوع نيوكليوتيدات COI في عينات تمهيدية من الأنواع غير المهددة. أخيرًا ، اختبرنا الإطار المقارن ببيانات من الأنواع ذات الصدفتين المهددة بالانقراض ، بينا نوبيليس. نستنتج أن تنوع النيوكليوتيدات في COI هو وكيل جيد للتقييم الأول لحالة حفظ مجموعات الأنواع ، حيث تفتقر المعرفة السابقة ويصعب إجراء التعداد.


شكر وتقدير

نحن ممتنون لـ Eoghan Harrington وأعضاء مجموعة Bork في EMBL للمناقشات المفيدة والمساعدة. كما نشكر Sergej Andrejev للمساعدة في تطبيق FCA. نود أن نشكر جان لويس بيتي للمساعدة التقنية الممتازة وسابين تريكو لخبرتها في LC / MS. نشكر أيضًا Véronique de Berardinis على منحنا إمكانية الوصول إلى مجموعة السلالات البكتيرية Genoscope. تلقى البحث المؤدي إلى هذه النتائج تمويلًا من مجلس أبحاث العلوم الطبيعية والهندسة في كندا (NSERC) و CEA و CNRS وجامعة Evry و EMBL. نحن ممتنون لخدمة Y. Yuan و EMBL IT للدعم الفني والحاسبي

الكاتب الاشتراكات: صمم PB وأشرف على هذه الدراسة. أجرى TY جميع تحليلات المعلوماتية الحيوية. حللت TY و ASW البيانات. كتب المخطوطة PB و TY و ASW. ساهم JR في تصميم هذه الدراسة. ساهم KRP و AZ في النمذجة الأيضية. أجرى NP و AP و MS التجارب. قدم JW الدعم الفني والمشورة المفاهيمية.


شاهد الفيديو: عــــــالم الفيروسات الحلقة الكاملة (كانون الثاني 2022).