Trang này mô tả Bio.AlignIO
, giao diện đầu vào/đầu ra liên kết nhiều chuỗi mới cho Biopython 1.46 trở lên.
Ngoài tài liệu API tích hợp, còn có cả một chương trong hướng dẫn về Bio.alignio, và mặc dù có một số sự chồng chéo, nó cũng đáng đọc ngoài trang này. Ngoài ra còn có tài liệu API [mà bạn có thể đọc trực tuyến hoặc từ bên trong Python với lệnh help[]
].
Mục tiêu
Bạn có thể đã quen thuộc với mô -đun Bio.Seqio liên quan đến các tệp chứa một hoặc nhiều chuỗi được biểu thị dưới dạng các đối tượng SeqRecord. Mục đích của mô -đun SeqIO
là cung cấp một giao diện thống nhất đơn giản cho các định dạng tệp trình tự.
Tương tự, Bio.AlignIO
liên quan đến các tệp chứa một hoặc nhiều chuỗi sắp xếp được biểu thị dưới dạng các đối tượng căn chỉnh. Bio.AlignIO
sử dụng cùng một bộ chức năng cho đầu vào và đầu ra như trong
from Bio import AlignIO
alignment = AlignIO.read[open["PF09395_seed.sth"], "stockholm"]
print["Alignment length %i" % alignment.get_alignment_length[]]
for record in alignment:
print[record.seq + " " + record.id]
1 và cùng tên cho các định dạng tệp được hỗ trợ.Lưu ý rằng việc bao gồm Bio.AlignIO
không dẫn đến một số trùng lặp hoặc lựa chọn trong cách xử lý một số định dạng tệp. Ví dụ: cả Bio.AlignIO
và
from Bio import AlignIO
alignment = AlignIO.read[open["PF09395_seed.sth"], "stockholm"]
print["Alignment length %i" % alignment.get_alignment_length[]]
for record in alignment:
print[record.seq + " " + record.id]
4 sẽ đọc các sắp xếp từ các tệp nexus - nhưng from Bio import AlignIO
alignment = AlignIO.read[open["PF09395_seed.sth"], "stockholm"]
print["Alignment length %i" % alignment.get_alignment_length[]]
for record in alignment:
print[record.seq + " " + record.id]
5 cho phép kiểm soát nhiều hơn và sử dụng cây.Tầm nhìn của tôi là để đọc hoặc viết sự sắp xếp trình tự, bạn nên thử Bio.AlignIO
như là lựa chọn đầu tiên của bạn. Trong một số trường hợp, bạn chỉ có thể quan tâm đến các chuỗi, trong trường hợp đó, hãy thử sử dụng Bio.Seqio trên tệp căn chỉnh trực tiếp. Trừ khi bạn có một số yêu cầu rất cụ thể, tôi hy vọng điều này sẽ đủ.
Peter
Định dạng tệp
Bảng này liệt kê các định dạng tệp mà Bio.alignio có thể đọc và viết, với phiên bản Biopython nơi điều này được hỗ trợ lần đầu tiên.
Tên định dạng là một chuỗi chữ thường đơn giản, khớp các tên được sử dụng trong Bio.Seqio. Nếu có thể, chúng tôi sử dụng cùng tên với BioPerl xông Seqio và Têm chiều.
Clustal | 1.46 | 1.46 | Định dạng căn chỉnh của Clustal X và Clustal W. |
T nổi | 1.46 | Không | Các định dạng căn chỉnh đơn giản/cặp. |
fasta | 1.46 | 1.48 | Điều này đề cập đến định dạng tệp đầu vào được giới thiệu cho công cụ Bill Pearson Fasta, trong đó mỗi bản ghi bắt đầu bằng một dòng>>. Lưu ý rằng việc lưu trữ nhiều hơn một căn chỉnh trong định dạng này là mơ hồ. Viết các tệp FASTA với Alignio không thành công trước khi phát hành 1.48 [Bug 2557]. |
Fasta-M10 | 1.46 | Không | Các định dạng căn chỉnh đơn giản/cặp. |
fasta | 1.47 | Không | Các định dạng căn chỉnh đơn giản/cặp. |
fasta | 1.69 | 1.69 | Điều này đề cập đến định dạng tệp đầu vào được giới thiệu cho công cụ Bill Pearson Fasta, trong đó mỗi bản ghi bắt đầu bằng một dòng>>. Lưu ý rằng việc lưu trữ nhiều hơn một căn chỉnh trong định dạng này là mơ hồ. Viết các tệp FASTA với Alignio không thành công trước khi phát hành 1.48 [Bug 2557]. |
Fasta-M10 | 1.70 | 1.70 | Điều này đề cập đến đầu ra căn chỉnh theo cặp từ các công cụ Bill Pearson, Fasta, cụ thể là phiên bản có thể đọc được của máy khi tùy chọn dòng lệnh -M 10 được sử dụng. Đầu ra văn bản định dạng miễn phí mặc định từ các công cụ FASTA không được hỗ trợ. |
ig | 1.75 | Không | Các định dạng căn chỉnh đơn giản/cặp. |
fasta | 1.46 | 1.48 | Điều này đề cập đến định dạng tệp đầu vào được giới thiệu cho công cụ Bill Pearson Fasta, trong đó mỗi bản ghi bắt đầu bằng một dòng>>. Lưu ý rằng việc lưu trữ nhiều hơn một căn chỉnh trong định dạng này là mơ hồ. Viết các tệp FASTA với Alignio không thành công trước khi phát hành 1.48 [Bug 2557]. |
Fasta-M10 | 1.46 | 1.46 | Điều này đề cập đến đầu ra căn chỉnh theo cặp từ các công cụ Bill Pearson, Fasta, cụ thể là phiên bản có thể đọc được của máy khi tùy chọn dòng lệnh -M 10 được sử dụng. Đầu ra văn bản định dạng miễn phí mặc định từ các công cụ FASTA không được hỗ trợ. |
ig | 1.59 | 1.59 | Các đề cập đến định dạng tệp thông minh thường được sử dụng cho các chuỗi không liên kết thông thường. Công cụ Mase cũng dường như sử dụng cùng một định dạng tệp để sắp xếp, do đó đưa vào bảng này. Xem định dạng mase. |
MAF | 1.58 | 1.58 | Định dạng căn chỉnh [MAF] được sản xuất bởi Multiz. Được sử dụng để lưu trữ các bộ gen toàn bộ bộ gen, chẳng hạn như sắp xếp 30 chiều có sẵn từ trình duyệt bộ gen của UCSC. |
Maove | 1.46 | 1.46 | Định dạng tệp MUUVE MUTI-FASTA [XMFA] mở rộng Mauve |
MSF | MSF | MSF | MSF |
Định dạng tệp GCG MSF.
Nexus
Còn được gọi là định dạng paup. Sử dụng Bio.nexus nội bộ. Chỉ có một căn chỉnh cho mỗi tệp được hỗ trợ.
Phylip
Đây là một cách giải thích nghiêm ngặt về định dạng phylip xen kẽ cắt tên ở 10 ký tự.
# STOCKHOLM 1.0
#=GS Q7ZVG7_BRARE/37-110 AC Q7ZVG7.1
#=GS Q6X871_SCAAQ/1-77 AC Q6X871.1
#=GS O02676_CROCR/1-77 AC O02676.1
#=GS Q6X869_TENEC/1-77 AC Q6X869.1
#=GS FIBG_HUMAN/40-116 AC P02679.3
#=GS O02689_TAPIN/1-77 AC O02689.1
#=GS O02688_PIG/1-77 AC O02688.1
#=GS O02672_9CETA/1-77 AC O02672.1
#=GS O02682_EQUPR/1-77 AC O02682.1
#=GS Q6X870_CYNVO/1-77 AC Q6X870.1
#=GS FIBG_RAT/40-116 AC P02680.3
#=GS Q6X866_DROAU/1-76 AC Q6X866.1
#=GS O93568_CHICK/40-116 AC O93568.1
#=GS FIBG_XENLA/38-114 AC P17634.1
Q7ZVG7_BRARE/37-110 GFGTYCPTTCGVADYLQRYKPDMDKKLDDMEQDLEEIANLTRGAQDKVVYLK---DSEAQAQKQSPDTYIKKSSNML
Q6X871_SCAAQ/1-77 RFGSYCPTTCGIADFLSTYQATVDKDLQTLEDILSQAENKTMEAKELVKAIQVSYLPEDPARPNRVELATKDSKKMM
O02676_CROCR/1-77 RFGSYCPTTCGIADFLSTYQTGVXNDLRTLEDLLSGIENKTSEAKELIKSIQVSYNPNEPPKPNTIVSATKDSKKMM
Q6X869_TENEC/1-77 RFGSYCPTTCGIADFLSTYQGSIDKDLQTLEDILNQVENKTXEASELIKSIQVSYNPDEPPRPNMIEGATQKSKKML
FIBG_HUMAN/40-116 RFGSYCPTTCGIADFLSTYQTKVDKDLQSLEDILHQVENKTSEVKQLIKAIQLTYNPDESSKPNMIDAATLKSRKML
#=GS FIBG_HUMAN/40-116 DR PDB; 1qvh L;14-45
#=GS FIBG_HUMAN/40-116 DR PDB; 1fza C;88-90
#=GS FIBG_HUMAN/40-116 DR PDB; 1fzb C;88-90
#=GS FIBG_HUMAN/40-116 DR PDB; 1fzb F;88-90
#=GS FIBG_HUMAN/40-116 DR PDB; 1qvh I;14-45
#=GS FIBG_HUMAN/40-116 DR PDB; 1fza F;88-90
#=GR FIBG_HUMAN/40-116 SS CCXCXBXXHHHHHHHHHHHHHHHHHHHHHHHXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX-CC
O02689_TAPIN/1-77 RFGSYCPTTCGIADFLSTYQTXVDKDLQVLEDILNQAENKTSEAKELIKAIQVRYKPDEPTKPGGIDSATRESKKML
O02688_PIG/1-77 RFGSYCPTMCGIAGFLSTYQNTVEKDLQNLEGILHQVENKTSEARELIKAIQISYNPEDLSKPDRIQSATKESKKML
O02672_9CETA/1-77 RFGSYCPTTCGVADFLSNYQTSVDKDLQNLEGILYQVENKTSEARELVKAIQISYNPDEPSKPNNIESATKNSKRMM
O02682_EQUPR/1-77 RFGSYCPTTCGIADFLSNYQTSVDKDLQDFEDILHRAENQTSEAEQLIQAIRTSYNPDEPPKTGRIDAATRESKKMM
Q6X870_CYNVO/1-77 RFGSYCPTTCGIADFLSTYQTKVDEDLQNLEDILYRVENRTSEAKELIKAIQVDYNPGEPPKQSVTEGATQNAKKMV
FIBG_RAT/40-116 RFGSYCPTTCGISDFLNSYQTDVDTDLQTLENILQRAENRTTEAKELIKAIQVYYNPDQPPKPGMIEGATQKSKKMV
Q6X866_DROAU/1-76 RFGSYCPTTCGIADFLNKYQTTIDQDLRHMEETLRDIDNKTAESTLLIQKIQIGQTPDPRPQ-NVIGDVTQKSRKMI
O93568_CHICK/40-116 RFGSYCPTTCGIADFFNKYRLTTDGELLEIEGLLQQATNSTGSIEYLIQHIKTIYPSEKQTLPQSIEQLTQKSKKII
#=GS O93568_CHICK/40-116 DR PDB; 1m1j F;14-90
#=GS O93568_CHICK/40-116 DR PDB; 1m1j C;14-90
#=GR O93568_CHICK/40-116 SS CCEEEEE-CCCCCCCCCCCCCHHHCCCCCHHHHHHHHHHHHHHHCCCCCCHHHHS-SSTT--SS-HHHHHHHHHHHH
FIBG_XENLA/38-114 RFGEYCPTTCGISDFLNRYQENVDTDLQYLENLLTQISNSTSGTTIIVEHLIDSGKKPATSPQTAIDPMTQKSKTCW
#=GC SS_cons CCECEEE-CCCCCCCCCCCCCHHHCCCCCHHHHHHHHHHHHHHHCCCCCCHHHHS-SSTT--SS-HHHHHHHHHHCC
#=GC seq_cons RFGSYCPTTCGIADFLSsYQssVDcDLQsLEsILpplEN+ToEAc-LIKuIQlsYsP--ss+PstI-uATpcSKKMl
//
Bạn sẽ nhận thấy rằng có rất nhiều thông tin chú thích ở đây, bao gồm các số gia nhập cho mỗi chuỗi và một số tài liệu tham khảo chéo cơ sở dữ liệu PDB và thông tin cấu trúc thứ cấp cho protein fibrinogen của con người và gà.
Tệp này chứa một căn chỉnh duy nhất, vì vậy chúng ta có thể sử dụng hàm
from Bio import AlignIO
alignment = AlignIO.read[open["PF09395_seed.sth"], "stockholm"]
print["Alignment length %i" % alignment.get_alignment_length[]]
for record in alignment:
print[record.seq + " " + record.id]
7 để tải nó trong Biopython. Hãy giả sử rằng bạn đã tải xuống căn chỉnh này từ Sanger hoặc đã sao chép và dán văn bản ở trên, và lưu nó dưới dạng tệp gọi là Alignment length 77
GFGTYCPTTCGVADYLQRYKPDMDKKLDDMEQDLEEIANLTRGAQDKVVYLK---DSEAQAQKQSPDTYIKKSSNML Q7ZVG7_BRARE/37-110
RFGSYCPTTCGIADFLSTYQATVDKDLQTLEDILSQAENKTMEAKELVKAIQVSYLPEDPARPNRVELATKDSKKMM Q6X871_SCAAQ/1-77
RFGSYCPTTCGIADFLSTYQTGVXNDLRTLEDLLSGIENKTSEAKELIKSIQVSYNPNEPPKPNTIVSATKDSKKMM O02676_CROCR/1-77
RFGSYCPTTCGIADFLSTYQGSIDKDLQTLEDILNQVENKTXEASELIKSIQVSYNPDEPPRPNMIEGATQKSKKML Q6X869_TENEC/1-77
RFGSYCPTTCGIADFLSTYQTKVDKDLQSLEDILHQVENKTSEVKQLIKAIQLTYNPDESSKPNMIDAATLKSRKML FIBG_HUMAN/40-116
RFGSYCPTTCGIADFLSTYQTXVDKDLQVLEDILNQAENKTSEAKELIKAIQVRYKPDEPTKPGGIDSATRESKKML O02689_TAPIN/1-77
RFGSYCPTMCGIAGFLSTYQNTVEKDLQNLEGILHQVENKTSEARELIKAIQISYNPEDLSKPDRIQSATKESKKML O02688_PIG/1-77
RFGSYCPTTCGVADFLSNYQTSVDKDLQNLEGILYQVENKTSEARELVKAIQISYNPDEPSKPNNIESATKNSKRMM O02672_9CETA/1-77
RFGSYCPTTCGIADFLSNYQTSVDKDLQDFEDILHRAENQTSEAEQLIQAIRTSYNPDEPPKTGRIDAATRESKKMM O02682_EQUPR/1-77
RFGSYCPTTCGIADFLSTYQTKVDEDLQNLEDILYRVENRTSEAKELIKAIQVDYNPGEPPKQSVTEGATQNAKKMV Q6X870_CYNVO/1-77
RFGSYCPTTCGISDFLNSYQTDVDTDLQTLENILQRAENRTTEAKELIKAIQVYYNPDQPPKPGMIEGATQKSKKMV FIBG_RAT/40-116
RFGSYCPTTCGIADFLNKYQTTIDQDLRHMEETLRDIDNKTAESTLLIQKIQIGQTPDPRPQ-NVIGDVTQKSRKMI Q6X866_DROAU/1-76
RFGSYCPTTCGIADFFNKYRLTTDGELLEIEGLLQQATNSTGSIEYLIQHIKTIYPSEKQTLPQSIEQLTQKSKKII O93568_CHICK/40-116
RFGEYCPTTCGISDFLNRYQENVDTDLQYLENLLTQISNSTSGTTIIVEHLIDSGKKPATSPQTAIDPMTQKSKTCW FIBG_XENLA/38-114
0 trên máy tính của bạn. Sau đó, trong Python:from Bio import AlignIO
alignment = AlignIO.read[open["PF09395_seed.sth"], "stockholm"]
print["Alignment length %i" % alignment.get_alignment_length[]]
for record in alignment:
print[record.seq + " " + record.id]
Điều đó sẽ cho:
Alignment length 77
GFGTYCPTTCGVADYLQRYKPDMDKKLDDMEQDLEEIANLTRGAQDKVVYLK---DSEAQAQKQSPDTYIKKSSNML Q7ZVG7_BRARE/37-110
RFGSYCPTTCGIADFLSTYQATVDKDLQTLEDILSQAENKTMEAKELVKAIQVSYLPEDPARPNRVELATKDSKKMM Q6X871_SCAAQ/1-77
RFGSYCPTTCGIADFLSTYQTGVXNDLRTLEDLLSGIENKTSEAKELIKSIQVSYNPNEPPKPNTIVSATKDSKKMM O02676_CROCR/1-77
RFGSYCPTTCGIADFLSTYQGSIDKDLQTLEDILNQVENKTXEASELIKSIQVSYNPDEPPRPNMIEGATQKSKKML Q6X869_TENEC/1-77
RFGSYCPTTCGIADFLSTYQTKVDKDLQSLEDILHQVENKTSEVKQLIKAIQLTYNPDESSKPNMIDAATLKSRKML FIBG_HUMAN/40-116
RFGSYCPTTCGIADFLSTYQTXVDKDLQVLEDILNQAENKTSEAKELIKAIQVRYKPDEPTKPGGIDSATRESKKML O02689_TAPIN/1-77
RFGSYCPTMCGIAGFLSTYQNTVEKDLQNLEGILHQVENKTSEARELIKAIQISYNPEDLSKPDRIQSATKESKKML O02688_PIG/1-77
RFGSYCPTTCGVADFLSNYQTSVDKDLQNLEGILYQVENKTSEARELVKAIQISYNPDEPSKPNNIESATKNSKRMM O02672_9CETA/1-77
RFGSYCPTTCGIADFLSNYQTSVDKDLQDFEDILHRAENQTSEAEQLIQAIRTSYNPDEPPKTGRIDAATRESKKMM O02682_EQUPR/1-77
RFGSYCPTTCGIADFLSTYQTKVDEDLQNLEDILYRVENRTSEAKELIKAIQVDYNPGEPPKQSVTEGATQNAKKMV Q6X870_CYNVO/1-77
RFGSYCPTTCGISDFLNSYQTDVDTDLQTLENILQRAENRTTEAKELIKAIQVYYNPDQPPKPGMIEGATQKSKKMV FIBG_RAT/40-116
RFGSYCPTTCGIADFLNKYQTTIDQDLRHMEETLRDIDNKTAESTLLIQKIQIGQTPDPRPQ-NVIGDVTQKSRKMI Q6X866_DROAU/1-76
RFGSYCPTTCGIADFFNKYRLTTDGELLEIEGLLQQATNSTGSIEYLIQHIKTIYPSEKQTLPQSIEQLTQKSKKII O93568_CHICK/40-116
RFGEYCPTTCGISDFLNRYQENVDTDLQYLENLLTQISNSTSGTTIIVEHLIDSGKKPATSPQTAIDPMTQKSKTCW FIBG_XENLA/38-114
Đầu ra căn chỉnh
Như trong Bio.Seqio, có một hàm đầu ra duy nhất
Alignment length 77
GFGTYCPTTCGVADYLQRYKPDMDKKLDDMEQDLEEIANLTRGAQDKVVYLK---DSEAQAQKQSPDTYIKKSSNML Q7ZVG7_BRARE/37-110
RFGSYCPTTCGIADFLSTYQATVDKDLQTLEDILSQAENKTMEAKELVKAIQVSYLPEDPARPNRVELATKDSKKMM Q6X871_SCAAQ/1-77
RFGSYCPTTCGIADFLSTYQTGVXNDLRTLEDLLSGIENKTSEAKELIKSIQVSYNPNEPPKPNTIVSATKDSKKMM O02676_CROCR/1-77
RFGSYCPTTCGIADFLSTYQGSIDKDLQTLEDILNQVENKTXEASELIKSIQVSYNPDEPPRPNMIEGATQKSKKML Q6X869_TENEC/1-77
RFGSYCPTTCGIADFLSTYQTKVDKDLQSLEDILHQVENKTSEVKQLIKAIQLTYNPDESSKPNMIDAATLKSRKML FIBG_HUMAN/40-116
RFGSYCPTTCGIADFLSTYQTXVDKDLQVLEDILNQAENKTSEAKELIKAIQVRYKPDEPTKPGGIDSATRESKKML O02689_TAPIN/1-77
RFGSYCPTMCGIAGFLSTYQNTVEKDLQNLEGILHQVENKTSEARELIKAIQISYNPEDLSKPDRIQSATKESKKML O02688_PIG/1-77
RFGSYCPTTCGVADFLSNYQTSVDKDLQNLEGILYQVENKTSEARELVKAIQISYNPDEPSKPNNIESATKNSKRMM O02672_9CETA/1-77
RFGSYCPTTCGIADFLSNYQTSVDKDLQDFEDILHRAENQTSEAEQLIQAIRTSYNPDEPPKTGRIDAATRESKKMM O02682_EQUPR/1-77
RFGSYCPTTCGIADFLSTYQTKVDEDLQNLEDILYRVENRTSEAKELIKAIQVDYNPGEPPKQSVTEGATQNAKKMV Q6X870_CYNVO/1-77
RFGSYCPTTCGISDFLNSYQTDVDTDLQTLENILQRAENRTTEAKELIKAIQVYYNPDQPPKPGMIEGATQKSKKMV FIBG_RAT/40-116
RFGSYCPTTCGIADFLNKYQTTIDQDLRHMEETLRDIDNKTAESTLLIQKIQIGQTPDPRPQ-NVIGDVTQKSRKMI Q6X866_DROAU/1-76
RFGSYCPTTCGIADFFNKYRLTTDGELLEIEGLLQQATNSTGSIEYLIQHIKTIYPSEKQTLPQSIEQLTQKSKKII O93568_CHICK/40-116
RFGEYCPTTCGISDFLNRYQENVDTDLQYLENLLTQISNSTSGTTIIVEHLIDSGKKPATSPQTAIDPMTQKSKTCW FIBG_XENLA/38-114
1. Điều này có ba đối số: một số sắp xếp, một tay cầm tệp để ghi và định dạng để sử dụng.Bạn có thể sử dụng hàm
Alignment length 77
GFGTYCPTTCGVADYLQRYKPDMDKKLDDMEQDLEEIANLTRGAQDKVVYLK---DSEAQAQKQSPDTYIKKSSNML Q7ZVG7_BRARE/37-110
RFGSYCPTTCGIADFLSTYQATVDKDLQTLEDILSQAENKTMEAKELVKAIQVSYLPEDPARPNRVELATKDSKKMM Q6X871_SCAAQ/1-77
RFGSYCPTTCGIADFLSTYQTGVXNDLRTLEDLLSGIENKTSEAKELIKSIQVSYNPNEPPKPNTIVSATKDSKKMM O02676_CROCR/1-77
RFGSYCPTTCGIADFLSTYQGSIDKDLQTLEDILNQVENKTXEASELIKSIQVSYNPDEPPRPNMIEGATQKSKKML Q6X869_TENEC/1-77
RFGSYCPTTCGIADFLSTYQTKVDKDLQSLEDILHQVENKTSEVKQLIKAIQLTYNPDESSKPNMIDAATLKSRKML FIBG_HUMAN/40-116
RFGSYCPTTCGIADFLSTYQTXVDKDLQVLEDILNQAENKTSEAKELIKAIQVRYKPDEPTKPGGIDSATRESKKML O02689_TAPIN/1-77
RFGSYCPTMCGIAGFLSTYQNTVEKDLQNLEGILHQVENKTSEARELIKAIQISYNPEDLSKPDRIQSATKESKKML O02688_PIG/1-77
RFGSYCPTTCGVADFLSNYQTSVDKDLQNLEGILYQVENKTSEARELVKAIQISYNPDEPSKPNNIESATKNSKRMM O02672_9CETA/1-77
RFGSYCPTTCGIADFLSNYQTSVDKDLQDFEDILHRAENQTSEAEQLIQAIRTSYNPDEPPKTGRIDAATRESKKMM O02682_EQUPR/1-77
RFGSYCPTTCGIADFLSTYQTKVDEDLQNLEDILYRVENRTSEAKELIKAIQVDYNPGEPPKQSVTEGATQNAKKMV Q6X870_CYNVO/1-77
RFGSYCPTTCGISDFLNSYQTDVDTDLQTLENILQRAENRTTEAKELIKAIQVYYNPDQPPKPGMIEGATQKSKKMV FIBG_RAT/40-116
RFGSYCPTTCGIADFLNKYQTTIDQDLRHMEETLRDIDNKTAESTLLIQKIQIGQTPDPRPQ-NVIGDVTQKSRKMI Q6X866_DROAU/1-76
RFGSYCPTTCGIADFFNKYRLTTDGELLEIEGLLQQATNSTGSIEYLIQHIKTIYPSEKQTLPQSIEQLTQKSKKII O93568_CHICK/40-116
RFGEYCPTTCGISDFLNRYQENVDTDLQYLENLLTQISNSTSGTTIIVEHLIDSGKKPATSPQTAIDPMTQKSKTCW FIBG_XENLA/38-114
2 để biến căn chỉnh thành một chuỗi chứa căn chỉnh trong định dạng tệp đã chỉ định, ví dụ:AlignIO.read[open["PF09395_seed.sth"], "stockholm"]
print[format[alignment, "fasta"]]
Hoặc sử dụng chuỗi F:
print[f"Alignment in FASTA format:\n\n{alignment:fasta}"]
Vui lòng tham khảo Chương Bio.Alignio trong hướng dẫn để biết thêm chi tiết.
Chuyển đổi định dạng tệp
Giả sử bạn có một tệp chứa [các] căn chỉnh phylip mà bạn muốn chuyển đổi thành định dạng PFAM/Stockholm:
from Bio import AlignIO
input_handle = open["example.phy", "rU"]
output_handle = open["example.sth", "w"]
alignments = AlignIO.parse[input_handle, "phylip"]
AlignIO.write[alignments, output_handle, "stockholm"]
output_handle.close[]
input_handle.close[]
Bằng cách thay đổi chuỗi định dạng, mã đó có thể được sử dụng để chuyển đổi giữa bất kỳ định dạng tệp được hỗ trợ nào.