java实现重复的DNA序列
一 题目描述:
所有 DNA 都由一系列缩写为 'A','C','G' 和 'T' 的核苷酸组成,例如:"ACGAATTCCG"。在研究 DNA 时,识别 DNA 中的重复序列有时会对研究非常有帮助。
编写一个函数来找出所有目标子串,目标子串的长度为 10,且在 DNA 字符串 s 中出现次数超过一次。
leetcode链接:重复的DNA序列
二 算法思路
因为题目的特殊性,我们可以采用空间换时间复杂度的思想,把10个长度单位的字符串存在集合中,如果出现了重复元素,直接放到结果集里即可。
三 算法实现
public List<String> findRepeatedDnaSequences(String s) {
List<String> result = new ArrayList<>();
Set<String> existString = new HashSet<>();
if (s.length() <= 10) {
return result;
}
for (int i = 0; i <= s.length() - 10; i++) {
String temp = s.substring(i, i + 10);
if (existString.contains(temp) && !result.contains(temp)) {
result.add(temp);
}
existString.add(temp);
}
return result;
}