Tryptophan
Finns det till exempel en anledning att "W" specifikt valdes för tryptofan (annat än att "T" togs)?
När du har tilldelat de andra 19 aminosyrorna, finns det bara 7 bokstäver i alfabetet kvar: B, J, O, U, W, X och Z. (Visst inte en trevlig Scrabble hand to have!)
Om man vill använda en bokstav som finns inom namnet på aminosyran, skulle den enda bokstaven vara O. Användningen av U och O avskräcktes historiskt eftersom dessa bokstäver kunde lätt förväxlas med andra bokstäver (U med V; O med G, Q, C, D och siffran 0).
Det visar sig att valet gjordes eftersom W är mycket fet bokstav och påminde om det indolringsystem som finns i tryptofan (den enda aminosyran som innehåller ett bicykliskt system). (Se nedan för källa.)
Vad hände med de andra sex bokstäverna då?
Alla 26 bokstäver i alfabetet kan nu användas som en bokstavskod för aminosyror eller olika kombinationer därav.
Efter upptäckten tilldelades selenocystein och pyrrolysin (den senare endast i bakterier) U respektive O. Vidare används B för att representera asparaginsyra ELLER asparagin; J används för att representera leucin ELLER isoleucin; Z används för att representera glutaminsyra ELLER glutamin; och X används för att representera en okänd aminosyra.
Jag tror att B och Z finner användning eftersom syrahydrolys ofta används för att bryta peptidbindningar vid proteinsekvensering. Detta har den oönskade bieffekten av att hydrolysera amidgrupperna i asparagin / glutamin, vilket leder till bildandet av asparaginsyra / glutaminsyror, vilket innebär att man inte kan säga exakt vilken aminosyra det var i början. J används i NMR-spektroskopi där isoleucin och leucin är svåra att skilja.
Varför valde de bokstäverna de gjorde?
Såvitt jag känner till antas användningen av enbokstavssymboler av både IUPAC och IUB (sedan 1991, IUBMB) i deras gemensamma rekommendationer från 1983 om "Nomenklatur och symbolik för aminosyror och peptider". 1 ankit7540: s kortfattade sammanfattning av den historiska utvecklingen nämnde redan dessa rekommendationer.
I synnerhet Avsnitt 3AA-21.2 "Kodsymbolerna" har en beskrivning av varför bokstäverna var vald. Detta dokument är förmodligen den mest auktoritära inställningen i frågan. Motivet är mestadels i linje med Jans svar:
Initiala bokstäver med namnen på aminosyrorna valdes där det inte fanns någon tvetydighet. Det finns sex sådana fall: cystein, histidin. isoleucin, metionin, serin och valin. Alla andra aminosyror delar de första bokstäverna A, G, L, P eller T, så godtyckliga uppdrag gjordes. Dessa bokstäver tilldelades de vanligast förekommande och strukturellt enklaste aminosyrorna med dessa initialer, alanin (A), glycin (G), leucin (L), prolin (P) och treonin (T).
Andra uppdrag gjordes på basis av föreningar som kan vara till hjälp för att komma ihåg koden, t.ex. de fonetiska föreningarna av F för fenylalanin och R för arginin. För tryptofan är molekylens dubbla ring associerad med den skrymmande bokstaven W. Bokstäverna N och Q tilldelades asparagin respektive glutamin; D och E till asparaginsyra respektive glutaminsyra. K och Y valdes för de två återstående aminosyrorna, lysin och tyrosin, eftersom de av de få återstående bokstäverna var nära alfabetiskt mot de första bokstäverna i namnen. U och O undviks eftersom U lätt kan förväxlas med V i handskrivet material och O med G, Q, C och D i ofullkomliga datorutskrifter, och även med noll. J undviks eftersom det saknas på flera språk.
Två andra symboler är ofta nödvändiga för delvis bestämda sekvenser, så B tilldelades asparaginsyra eller asparagin när dessa inte har särskiljts; Z tilldelades på liknande sätt glutaminsyra eller glutamin. X betyder att identiteten hos en aminosyra inte är bestämd, eller att aminosyran är atypisk. när det gäller N / Q / D / E. Min bästa gissning är:
- D och E valdes möjligen för asparaginsyror och glutaminsyror eftersom de var det enda bokstavsparet kvar i rad, med betoning på deras kemiska likhet. Asparaginsyra är kortare än glutaminsyra av en metylengrupp (CH 2 ), så det får den tidigare bokstaven D.
- Glutamin låter som Q-tamin. Om du inte tycker att det låter lika upprepar du det 50 gånger tills du gör det.
- AsparagiNe tilldelades N.
Referens
- IUPAC-IUB Joint Commission on Biochemical Nomenclature. Nomenklatur och symbolism för aminosyror och peptider: Rekommendationer 1983. FEBS J. 1984, 138 (1), 9–37. DOI: 10.1111 / j.1432-1033.1984.tb07877.x. En HTML-version (kanske mer användarvänlig) finns på denna adress.