рефераты скачать
 
Главная | Карта сайта
рефераты скачать
РАЗДЕЛЫ

рефераты скачать
ПАРТНЕРЫ

рефераты скачать
АЛФАВИТ
... А Б В Г Д Е Ж З И К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Э Ю Я

рефераты скачать
ПОИСК
Введите фамилию автора:


Инфракрасная спектроскопия и спектроскопия кругового дихроизма. Методы определения вторичной структуры белков


Из приведенной таблицы видно, что четыре ортогональных базисных спектра дают значение s, нe превышающее уровень случайной ошибки. Но эксперименты показывают, что форма реконструированного таким образом спектра плохо совпадает с реальной. Пять ортогональных базисных спектров дают значение s, в два раза меньшее уровня случайной ошибки, и при этом хорошо воспроизводят форму спектра. Шесть ортогональных базисных спектров дают лишь незначительное улучшение.

Это объясняется тем, что оставшиеся базисные спектры представляют собой ни что иное, как “шум”, и их учет приводит лишь к увеличению ошибки при вычислениях. Авторы данного метода использовали для вычислений пять "наиболее значимых" ортогональных базисных спектров (m=5), полагая это количество оптимальным. Эти спектры представлены на рисунке 1.2.2.

Из выражения (1.2.17) следует, что


С = UB. (1.2.19)


Восстанавливая по сокращенному набору ортогональных базисных спектров исходный набор базисных спектров КД, можем написать:


, (1.2.20)


где  - исходные базисные спектры (i=1,., 16; k=1,.,42), а- - пять "наиболее значимых" ортогональных базисных спектров. Эксперименты по воспроизведению исходных белковых спектров по формуле (1.2.20) показывают, что среднеквадратичная ошибка при этом составляет от 0.08 до 0.25, что является весьма хорошим показателем.

Представим данные рентгеноструктурного анализа для 16 базисных белков в виде матрицы S размером 168, содержащей величины относительного содержания в каждом из белков восьми структурных элементов: спиральной структуры, включая a - и 310-спирали, антипараллельной и параллельной b-структуры, b-изгибов I, II, III типов, других видов b-изгибов и оставшейся (“неупорядоченной”) структуры.

Как можно предполагать из того факта, что исходный набор базисных спектров может быть полностью восстановлен но основе лишь пяти спектров ортогонального базисного набора, спектры КД белков в диапазоне от 178 до 260 нм содержат в себе информацию лишь о пяти независимых типах вторичной структуры.

С точки зрения независимости спектров КД в качестве таких типов вторичной структуры могут быть приняты комбинации обычных типов вторичной структуры (a-спирали, b-структуры и т.д.), соответствующие пяти "наиболее значимым" ортогональным базисным спектрам.

Если для ортогональных базисных спектров также ввести матрицу структурных данных D (168), то аналогично формуле (1.2.19) можно записать


S = UD (1.2.21)


Как показывает эксперимент, структурная матрица S может быть полностью восстановлена на основе лишь пяти комбинаций элементов вторичной структуры матрицы D, соответствующих пяти "наиболее значимым" ортогональным базисным спектрам. Таким образом, эти комбинации обычных типов вторичной структуры являются (с точки зрения независимости спектров КД) независимыми вторичными "суперструктурами":


Номер "супер-структуры"

a, 310

b

­¯

b

­­

b-изг.

I

b-изг.

II

b-изг.

III

b-изг.

др.

Ост.

типы

1

1.77

0.30

0.20

0.16

0.07

0.12

0.14

1.06

2

0.56

-0.47

-0.06

-0.04

-0.07

-0.01

-0.09

-0.76

3

0.06

0.38

-0.12

0.01

0.02

0.01

0.01

-0.18

4

0.00

0.06

0.27

-0.04

-0.02

0.00

0.03

-0.06

5

-0.01

-0.01

0.02

0.16

0.02

0.05

0.00

-0.03


Следовательно, восемь рассматриваемых в данном методе стандартных структурных классов, вообще говоря, не являются строго независимыми, так как все они также могут быть описаны с помощью пяти независимых “суперструктур”, описанных выше.

Для применения данного метода к анализу спектров КД произвольных белков необходимо, чтобы анализируемый спектр также быть снят в диапазоне от 178 до 260 нм. Поскольку при его аппроксимации базисными спектрами рассматривается лишь небольшой их набор, то проблемы, связанной с неустойчивостью метода наименьших квадратов, не возникает. Однако, очевидно, что приемлемые результаты возможно получить только в том случае, если структурные характеристики исследуемого белка достаточно хорошо представлены среди базисных белков. Для установления достоверности полученных результатов авторы метода рекомендуют использовать метод наименьших квадратов без ограничений на коэффициенты разложения (смотри условия (1.2.2)). При этом большие по модулю отрицательные коэффициенты  или большое отклонение их суммы от единицы свидетельствуют о том, что метод в данном случае неприменим. Подробнее об этом критерии будет говориться в следующем разделе.

Метод "выбора переменных" [7]. Обычный метод наименьших квадратов, используемый для представления произвольного спектра КД в виде линейной комбинации базисных спектров, имеет по сравнению с другими методами наибольшую гибкость. Это проявляется в том, что спектры базисных белков участвуют в разложении в различной степени в зависимости от характера конкретного спектра. Однако, эксперименты показывают, что наилучшее воспроизведение формы спектра не всегда дает лучшие результаты. Более того, метод наименьших квадратов оказывается неустойчивым к экспериментальной ошибке, если число используемых в разложении базисных спектров превышает информационное содержание анализируемого спектра (для спектров в диапазоне 178-260 нм оно приблизительно равно пяти, а в диапазоне 190-260 нм - четырем).

Метод "регуляризации" [4] решает эту проблему с помощью "регуляризатора", который стабилизирует систему, оставляя ей при этом значительную гибкость. Метод "ортогональных спектров" [5,6] достигает устойчивости метода наименьших квадратов за счет использования только пяти ортогональных базисных спектров, построенных на основе исходного набора спектров базисных белков. Однако, поскольку базисные спектры построены на основе фиксированного набора спектров базисных белков, степень участия последних при воспроизведении анализируемого спектра также оказывается в некоторой мере фиксированной, а гибкость метода - крайне низкой.

Метод "выбора переменных", суть которого будет описана ниже, основан на методе "ортогональных спектров", но обладает значительной гибкостью, достигаемой за счет использования при построении ортогональных базисных спектров различных наборов базисных белков, выбираемых с помощью статистической процедуры "выбора переменных". Рассмотрим смысл этой процедуры более подробно.

Предсказание вторичной структуры белка по его спектру КД должно удовлетворять двум важным условиям:

1.   Величины содержания в белке рассматриваемых структурных элементов не должны быть отрицательными: .

2.   Суммарное содержание в белке всех рассматриваемых типов структур должно быть равно единице (100%): .

Второе условие является особенно важным при анализе конформационных изменений белка при денатурации или связывании каких-либо лигандов. Во всех методах, описанных выше, оба эти условия вводятся непосредственно в процедуру нахождения коэффициентов  с помощью метода наименьших квадратов. Однако такое ограничение на коэффициенты может весьма заметным образом исказить результаты этой процедуры.

Для преодоления подобных недостатков авторы рассматриваемого метода не пользуются условиями (1) и (2) и допускают существование отрицательных коэффициентов  и отклонение их суммы от единицы. Появление подобных несоответствий свидетельствует о неуспехе метода и может быть объяснено наличием у некоторых базисных белков таких структурных форм, вкладов которых в спектр исследуемого белка не было обнаружено. Для избежания подобных ситуаций вводится процедура "выбора переменных", которая поочередно исключает белки из исходного базисного набора, а затем проводит вычисления с каждой из полученных комбинаций базисных белков, используя метод "ортогональных спектров". Эксперименты показали, что достоверность результатов значительно повышается по мере того, как сумма коэффициентов  приближается к единице. Повышение точности анализа было достигнуто даже при анализе спектров в укороченном диапазоне (190-260 нм).

Поскольку заранее не известно, какие из базисных белков содержат элементы, отсутствующие у исследуемого белка, и спектры которых необходимо исключить из исходного набора для улучшения результатов, рассматриваются все возможные комбинации из исходного набора 16 базисных спектров. Эта процедура выполняется в следующем порядке. Сначала из исходного набора исключаются поочередно по три базисных спектра на каждом шаге, а ортогональные базисные спектры строятся на основе оставшихся 13 исходных базисных спектров. Сравнение результатов, полученных для различных наборов из 13 базисных белков, выявляет один или два белка, которые являлись причиной отклонений коэффициентов  и их суммы от условий (1) и (2). Эти белки исключаются из исходного набора, и процедура повторяется до тех пор, пока не будут получены удовлетворительные результаты.

Критериями удовлетворительного решения, соответствующего оптимальному набору базисных спектров, являются следующие условия:

1.   Сумма коэффициентов  должна находиться в диапазоне от 0.96 до 1.05 (или, по крайней мере, от 0.90 до 1.10).

2.   Значение содержания произвольной структурной формы в исследуемом белке () должно быть выше - 0,05.

3.   Воспроизведение анализируемого спектра на основе выбранного набора базисных спектров должно быть лучше, чем при использовании полного их набора.

4.   Более предпочтительным является набор, содержащий большее число базисных спектров.

5.   Более предпочтительными являются те белки, спектры которых ближе к анализируемому спектру.

На практике в большинстве случаев удовлетворительных результатов удается достичь при исключении из исходного набора всего трех или четырех белков, причем среднеквадратичная ошибка при воспроизведении анализируемого спектра составляет меньше 0.2 единицы De. Если несколько наборов базисных белков оказываются удовлетворительными в одинаковой степени, то результаты, полученные на их основе, усредняются.

В заключение можно отметить, что метод "выбора переменных" является мощным средством анализа спектров КД белков в ситуациях, когда другие распространеннные методы дают заведомо неверные результаты.

Сравнение различных методов анализа спектров КД.Поскольку все методы анализа спектров КД имеют чисто эмпирический характер, каждый из них нуждается в экспериментальной проверке на белках с известными рентгеноструктурными данными. Обычно подобная проверка проводится на белках, включенных в базисный набор для данного метода. При этом белки поочередно исключаются по одному из этого набора, а их спектры анализируются на основе спектров оставшихся белков. После этого результаты, полученные для каждого типа вторичной структуры, сравниваются со значениями, полученными при рентгеноструктурном анализе, с помощью подсчета коэффициента корреляции между этими двумя наборами данных, определяемого следующим выражением:


.(1.2.22)


Здесь  и  - экспериментальный и рассчитанный наборы данных, n - число белков в базисном наборе. Значения коэффициента корреляции r лежат в диапазоне от - 1 до 1, причем значеия r, близкие к 1, свидетельствуют об успешном предсказании, характеризующимся достаточно высокой точностью. Значения r, близкие к 0 или - 1, говорят о случайном совпадении или полном несоответствии рассчитанных и экспериментальных данных.

Ниже приведены значения коэффициентов корреляции для четырех рассмотренных методов: метода "эталонных спектров" [2,3], метода "регуляризации" [4], метода "ортогональных спектров" [5,6] и метода "выбора переменных" [7]:


метод

диапазон,

коэффициент корреляции r


нм

a

b ­¯

b ­­

b ­¯+­­

b-изг.

Ост.

 [2,3]

190-240

0.85

-

-

0.25

-0.31

0.46

 [4]

190-240

0.96

-

-

0.94

0.31

0.49









 [5,6]

190-260

0.98

0.40

0.00

-0.27

0.18

0.24

 [7]

190-260

0.95

0.57

0.47

0.45

0.54

0.69









 [4]

178-260

0.96

0.23

0.39

0.12

0.51

0.64

 [5,6]

178-260

0.98

0.55

0.63

0.54

0.30

0.61

 [7]

178-260

0.97

0.78

0.67

0.76

0.49

0.86


1.3 Работа с пакетом программ STRUCTURE по анализу спектров КД белков


Пакет программ STRUCTURE разработан в институте белка РАН (1991-1992 К.С. Василенко). Он предназначен для анализа спектров кругового дихроизма белков и определения их вторичной структуры. Алгоритм анализа спектров основан на методах, описанных выше. Пакет STRUCTURE состоит из следующих программ и вспомогательных файлов:

-   STRUCTURE (файл structur.exe) - программа, обеспечивающая интерфейс для всех программ пакета, позволяющая также создавать и редактировать файлы данных в универсальном для всех программ формате.

-   CONTIN (файл contin.exe) - программа, определяющая вторичную структуру белка методом "регуляризации" [4].

-   PROVCD (файл provcd.exe) - программа, осуществляющая проведение статистического теста для программы CONTIN.

-   DEF_CLASS (файл def_clas.exe) - программа, определяющая тип третичной структуры белка.

-   CDESTIMATE (файл cdestima.exe) - программа, определяющая вторичную структуру белка методом "эталонных спектров" [3].

-   VARSELEC (файл varselec.exe) - программа, определяющая вторичную структуру белка методом "ортогональных спектров" с процедурой "выбора переменных" [7].

-   RUN.BAT - командный файл, используемый для запуска программ пакета в условиях недостаточного объема оперативной памяти.

-   *.DAT - файл, содержащий спектр КД белка, а также данные о его вторичной структуре (если они известны).

-   *.GRP - файл, содержащий список базисных спектров КД (принадлежащих одной из базисных групп).

-   *.STR - файл, содержащий набор структурных типов (элементов вторичной структуры белка).

После запуска файла structur.exe на экране появляется главное меню программы, состоящее из следующих пунктов:

1.   File - создание и редактирование файлов данных;

2.   Group - создание и редактирование групп базисных спектров КД белков;

3.   Calculate - выбор метода анализа, анализируемого спектра, группы базисных спектров, запуск вычислений и просмотр результатов;

4.   Options - выбор набора структурных типов;

5.   Setup - изменение цветового оформления окон программы;

6.   Quit - выход из программы.

В нижней части экрана располагаются три окна, содержащие информацию об анализируемом спектре КД (Protein), а также о выбранных для анализа группе базисных спектров (Group) и наборе типов вторичной структуры белка (Structures).

Создание и редактирование файлов данных. Создание и редактирование файлов данных осуществляется с помощью команд меню File/Create и File/Edit соответственно. В файл необходимо внести следующую информацию:

-   Комментарий длиной не более 45 символов (пункт меню Comment).

-   Идентификатор длиной не более 7 символов, который становится именем файла и автоматически приобретает расширение.dat (пункт меню Identificator).

-   Содержание в белке (относительные доли) различных типов вторичной структуры по данным рентгеноструктурного анализа (пункт меню Structure data). Эти данные необходимы только в случае использования вводимого спектра в дальнейшем в качестве базисного.

-   Диапазон и шаг по длинам волн, а также сам спектр КД (пункт меню Spectrum). Для программы CDESTIMATE диапазон анализируемого спектра не должен быть шире, чем 240 - 190 нм, а шаг должен быть равен 1 нм или больше. Для программы CONTIN число точек в анализируемом спектре не должно превышать 51. Для программ CONTIN, VARSELEC и PROVCD диапазон анализируемого спектра не должен быть шире диапазона базисных спектров, а шаг должен совпадать с шагом базисных спектров.

После ввода всей перечисленной выше информации необходимо сохранить ее с помощью пункта меню Save. При необходимости можно построить введенный спектр КД на экране в графическом виде с помощью пункта меню View.

Команды меню File/Load и File/Delete используются соответственно для добавления новых спектров в список рабочих спектров, запоминаемых программой, и для удаления из него ненужных спектров. Для добавления нового спектра с помощью команды Load необходимо указать имя файла, в котором он хранится (предварительно его надо записать в текущий каталог). При удалении какого-либо спектра из списка с помощью команды Delete соответствующий ему файл не удаляется, поэтому его всегда можно будет включить обратно в список с помощью команды Load.

Создание и редактирование групп базисных спектров. В программе STRUCTURE уже существует 6 предопределенных групп базисных спектров, соответствующих различным методам анализа спектров КД. Эти группы имеют следующие имена:

-     PG_3_16.GRP и PG_4_16.GRP - базисные наборы, состоящие из 16 спектров, использованные для анализа авторами метода "регуляризации" [4] (Provencher & Glockner), предназначенные для определения вторичной структуры по 3 и 4 структурным классам соответственно (смотри ниже);

-     PG_3_20.GRP и PG_4_20.GRP - базисные наборы, содержащие те же самые 16 спектров, что и в двух предыдущих наборах, плюс 4 спектра денатурированных белков;

-     HJ_16.GRP и HJ_22.GRP - базисные наборы, состоящие из 16 и 22 спектров соответственно, использованные для анализа авторами метода "ортогональных спектров" [7] (Henessey & Johnson), предназначенные для определения вторичной структуры по 5 структурным классам (смотри ниже).

В программе предусмотрена возможность создания собственных групп базисных спектров. Для этого необходимо воспользоваться командой главного меню Group/Create, позволяющей выбрать из списка существующих спектров те, которые вы хотите включить в свой базисный набор. Аналогичным образом осуществляется редактирование групп базисных спектров (команда главного меню Group/Edit). Удаление группы базисных спектров осуществляется с помощью команды главного меню Group/Delete.

Выбор набора структурных типов. В программе STRUCTURE предопределены следующие 3 набора типов вторичной структуры белка:


Provencher 3 (PG3.STR)


ALFA_hl (a-спираль)

BETA_sh (b-структура)

Remain (остальные типы)

Provencher 4 (PG4.STR)

ALFA_hl (a-спираль)

BETA_sh (b-структура)

BETA_tn (b-поворот)

Remain (остальные типы)

Johnson 5 (HJ.STR)

ALFA_hl (a-спираль)

BETA_Ash (антипараллельная b-структура)

BETA_Psh (параллельная b-структура)

BETA_tn (b-поворот)

Other (остальные типы)


Набор All structures (FULL.STR) содержит дополнительные типы вторичной структуры белка, однако он ни с одной из предопределенных групп базисных спектров не используется.

Страницы: 1, 2, 3


рефераты скачать
НОВОСТИ рефераты скачать
рефераты скачать
ВХОД рефераты скачать
Логин:
Пароль:
регистрация
забыли пароль?

рефераты скачать    
рефераты скачать
ТЕГИ рефераты скачать

Рефераты бесплатно, реферат бесплатно, рефераты на тему, сочинения, курсовые работы, реферат, доклады, рефераты, рефераты скачать, курсовые, дипломы, научные работы и многое другое.


Copyright © 2012 г.
При использовании материалов - ссылка на сайт обязательна.