The
aim of this study is to calculate the similarity ratio of the sequences in
different DNA samples. In order to increase the performance and shorten the
transaction volume of the DNA data, DNA sequences were compressed and DNA
motifs were obtained. For this, the LZ Compression algorithm was used. While
each of the obtained motifs was only a graph node, the order of these motifs
was transformed into graphs expressing the edge of the nodes. The obtained
graph from each DNA was used to find the similarity in DNA. According to the algorithms
calculating the similarity ratio on the graphs, we compared both Neighbor
Matching and Cosinus Similarity methods and then we showed that Cosinus
Similarity is more efficient than Neighbor Matching.
LZ Compression Neighbor Matching Cosinus Similarity Graph Similarity DNA pattern exploration
Bu
çalışmanın amacı farklı DNA örneklerindeki dizilimlerin benzerlik oranını
hesaplamaktır. DNA verilerinin büyüklüklerinin getirdiği işlem hacmini
kısaltmak ve performansı arttırmak için,DNA dizileri sıkıştırılıp motif
çıkarımı yapıldı. Bunun için LZ Sıkıştırma algoritması kullanıldı. Elde edilen
motiflerden her biri sadece bir graf düğümünü ifade ederken bu motiflerin
sırası da düğümlerin komşuluklarını ifade edecek şekilde grafa dönüştürüldü.
Her bir DNA’dan elde edilen graf, DNA’lardaki benzerliği bulabilmek için
kullanıldı. Graflar üzerinden benzerlik oranını hesaplayan algoritmalardan, her
iki Komşu Eşleşme ve Kosinüs Benzerliği metotlarını karşılaştırdık. Buna göre Kosinüs
Benzerliği’nin Komşu Eşleşme’ye göre daha performanslı olduğunu gösterdik.
Primary Language | Turkish |
---|---|
Subjects | Engineering |
Journal Section | Articles |
Authors | |
Publication Date | December 25, 2018 |
Published in Issue | Year 2018 Volume: 1 Issue: 1 |
Dergimizin Tarandığı Dizinler (İndeksler)
Academic Resource Index | Google Scholar | ASOS Index |
Rooting Index | The JournalTOCs Index | General Impact Factor (GIF) Index |
Directory of Research Journals Indexing | I2OR Index
|