Liechi

很不同,首先看看这个RNA碱基对构成的二级结构,可以看出RNA的结构多样性比cDNA的双螺旋高多了。

在进化当中RNA一般是保留这个二级结构,碱基对的位置在经典碱基对之间替换都OK(比如 AU换GC)。造成的结果就是 【序列】没有【结构】保守。所以传统方法只依据序列信息做比对的话,序列相似度降到80%以下就不可靠了。 传统的序列比对工具(ClustalW什么的)基本抓瞎, 目前最好的RNA比对工具Infernal也只是部分考虑了简单类型的RNA二级结构,我们做RNA序列比对的新工具可以把任意类型的RNA二级结构的信息考虑进来。

这个方向也是最近一两年RNA序列数据库数据积累足够多才开始慢慢有人做,再之前是想做也没那么多数据。

    tctcab 讲究。我猜也可能是结构不同造成的比对方式差异,等你论文发了再看细节吧。

    😅 我觉得,一般来讲,永远会因为数学知识的短板,增加专业知识的困难。因为永远是你数学知识越多,你学习专业的应用对方法insight(精髓?)的掌握就越高。比如你泛函学的很好很深,你学支持向量机一定就比不太会泛函的人学得快,虽然你不会也不是不能学......当然如果线代微积分不及格的话那就可能很难了

      tctcab 谢谢回复。谢谢分享学习工作体会。对我很有启发。
      请问你在中科大学的第一门数学课是“微积分”?还是“数学分析”

      你在当前工作中遇到没学过的数学知识,一般需要几步能和过去学过的数学知识接续上。

      举个虚构的例子,假设我只学过一元微积分。例如我工作中遇到统计知识。于是去看《统计导论》发现里面用到了《概率》的知识,于是我又去看《概率》的书,发现又需要多元微积分的知识。于是又去看多元微积分。多元微积分需要一元微积分的基础,于是接续上了。这样我用了三步完成了知识接续。

      以上面的例子位模板,你在接续数学知识的过程中一般是通读《统计》《概率》《多元微积分》(假设这三门课过去完全没学过)?还是只学特定章节?

        wglaive 谢谢回复。
        最近刚刚翻了一下数据挖掘,机器学习的书。深感数学的重要性。但是体会还没有达到你的高度。例如你举的例子:“比如你泛函学的很好很深,你学支持向量机一定就比不太会泛函的人学得快,虽然你不会也不是不能学”----------我现在遇到的情况是缺乏A知识就学不会B。暂时还没遇到缺乏A知识,B知识也能学会,就是学得慢。:))这泛函分析难道是类似乘法口诀表。或者常用三角函数公式的哪种口诀类的知识?:)))否则怎么会没他也行,有他更快。

        请问你在学习专业知识的时候如何在专业知识和数学知识之间分配精力。有什么经验或体会可以分享么?有什么数据科学从业人员经常逛的论坛推荐么?

          huangwu 因为支持向量机搞得人太多太成熟了,你随便去下一个lecture notes,第一二章基本上把你需要的泛函内容过了一遍了,你自然不用花大量的时间去把课程"泛函分析"从头到尾学一遍。所以学习阶梯不会那么陡峭。学过泛函以后快是因为可能这两章你就不用学或者扫一遍就完了(花时间少=快),没学过就得慢慢啃第一二章然后吃透。而且还可能都某些理论理解不深入(跳掉了某些不重要的定理什么的),导致学的比学过的慢。

          所以其实我们说的是一件事,只不过你的说法是"学会A知识"然后才能学"B知识"。我说的是,"学A,A1,A2,A3,.....Am" 会让学"B" 更轻松更快,A无论如何是逃不掉的。(某些先实践再理论的另说)。整体的泛函分析的课程就包括了"A,A1A2....",但是支持向量机的lecture notes的第一章可能只有"A".

          还有一种可能,就是基础理论有些会抽象过头,你明明只需要用实数空间上的,很多更一般空间的理论其实懂不懂关系不大,懂了你理解更快,不懂也不影响你用在实数空间这个特例。

          在你的例子中,用到了概率的知识,不代表你就得充分掌握borel空间上的映射,大数定理,中心极限定理(知道有那么个东西,定义是什么,在说什么问题就够了,不一定要学到会用)...而且一般统计里面设计的多元微积分也很简单,曲线曲面积分基本很少用,特别是初级的内容,自然你没必要通读多元微积分。当然如果你是快速学习者那另说,通读肯定会对你理解整个系统有很大帮助,强烈推荐T.W. Anderson的多元统计引论。前沿统计用到的很多基础东西这本书都有,如果通读吃透,我觉得你随便做哪个方向(特别是传统一点的方向)的数理统计博士都不会有问题.....(但是我没读下来)

            huangwu 高度问题,例如走迷宫,站在1楼可以走,如果站在2楼看迷宫对于迷宫的理解就不同了呢?那如果你站在10楼呢?

            数学的问题就是硬啃,坚持读完(实在看不懂跳过)坑定会有收获,当然如果数分还没看就看拓扑、测度那坑定是看不懂的。当你看完数学再去看统计你会从细节上看到很多以前觉得无所谓的东西,那时候你对于统计的理解和认识就不一样啦。当然如果仅仅是一般商业数据分析工作不懂数学其实也没啥关系,但是如果说对于数据的认识那就完全没法比。(按我老板的话,不懂测度就不懂概率,不懂概率学再多遍统计也没用)。

              我觉得这个问题主要取决于你未来从事工作的理论程度。如果对于比较理论的东西接触得多,甚至自己未来需要做一些证明的工作,那就我这个应数出身的人来看扎实的数分实变线代最优化等等自然是必要的,学没学过学得好不好对于理论性的东西理解深度速度差别大了。当然只是用用模型写写码的话我觉得就没那么多所谓。

                huangwu
                你的问题代表了一种常见心理,我管这个叫恐数理症。生物领域现在越来越多地需要数学和编程的辅助了,所以很多做生物学研究的人不断地问数学(其实是统计学)要学到什么水准,编程(基本上是在说 R 和 Python)要掌握到什么地步?什么时候算够?在我看来,这是只个心理问题---很多心理问题都是不充分接触实际困难,自己空想出来的。

                这么说吧,你其实不可能把你需要的所有先修知识都学好了再开始做"数据科学"的。先走起来,如果遇到不懂的概念造成麻烦了,就去现学它是啥意思,这么一环一环地学下去就可以了。有的人觉得学习是体系化的,得一层层往"上"走,中间哪层缺失了就走不动了。这种不那么对的想法造成了很多人面对未知领域时有心理障碍。

                等学完测度再学概率,再学统计,黄花菜都凉了,少年。

                  wglaive 谢谢回复。

                  “所以其实我们说的是一件事,只不过你的说法是"学会A知识"然后才能学"B知识"。我说的是,"学A,A1,A2,A3,.....Am" 会让学"B" 更轻松更快,A无论如何是逃不掉的。(某些先实践再理论的另说)。整体的泛函分析的课程就包括了"A,A1A2....",但是支持向量机的lecture notes的第一章可能只有"A".”--------------我明白了。

                  ''还有一种可能,就是基础理论有些会抽象过头,你明明只需要用实数空间上的,很多更一般空间的理论其实懂不懂关系不大,懂了你理解更快,不懂也不影响你用在实数空间这个特例。“-------------这个严重同意。有时候遇到一个数学问题,也知道其所属的哪一个数学细分领域。于是找到该领域的教材翻到指定章节去看。发现看不懂。事后回顾,发现看这里面往往分两种情况。
                  1、该书风格追求叙述的理论完备性,因此与该问题的有关的前因后果全都牵扯进来,超出了读者原有知识储备。一个问题变成了n个问题。而有一本简洁的书当中有一段关键的文字可以解决你的疑惑。但是你却没第一时间找到这本书。于是时间就这样过去了。
                  2、该书风格已经足够简洁了。真的是由于读者在这个方面知识漏洞太大。因此只能按部就班去补拼图。遇到这种情况即便花时间也是值得的。
                  请问你遇到问题去查资料的时候,如恶化感知当前是在情况1、还是情况2。有什么技巧快速识别出自己在情况1当中么?主要是像节省时间少走弯路。:))

                    CMCai0104 谢谢分享。
                    请教一下,你现在主要从事哪个领域的研究或工作?关于测度,有什么优质的中文书推荐么?

                    ocssLin 嗯嗯。一定是不会想那些有关理论突破的事情。大师的研究成果能理解用对就可以了。

                    Liechi 我觉得你关于心里的分析是很准确的:)))前方有雾谁都怕走上一条不归路。因此免不了向这条路上驰骋的人请教。
                    但是至少多元微积分和线代,概率,统计的入门课要先学完。其他的留待以后提高做准备。

                    huangwu 多看lecture notes,如果搜了3个以上lecture notes,第一章用来定义最基本元素的属于都不知道的话那就是情况2。因为一般lecture notes是老师为了上课准备的,一般不太会追求理论完备和严谨性,一般追求自洽和把故事说圆。如果还不行,那这个时间就是你该花的必要成本。有些时间是必须要花掉的

                      huangwu

                      • 请问你在中科大学的第一门数学课是“微积分”?还是“数学分析”

                      微积分,包括了一元多元微积分,我们生物没有安排数学分析。

                      • 你在当前工作中遇到没学过的数学知识,一般需要几步能和过去学过的数学知识接续上。

                      没仔细盘算过。进入一个新领域之后(在导师鼓励之下我经常跳来跳去)我一般细读3~4篇前沿工作看他们的研究范式和数学工具,一般来说跟已有的知识还是需要2~3步才能接上。这个准备阶段的话长则几个月,短则一两周,总之最后肯定是越来越快。

                      正如Liechi 说的

                      很多心理问题都是不充分接触实际困难,自己空想出来的

                      所以还是不要怕,多实践多读paper,碰到不懂的地方回去翻书查资料在做研究太正常了,在任何领域的小萌新都会碰到,而且具体问题/领域的细分下来,不同人需求也不同。即使是搞数据科学,其他人的经验也未必完全适用于你。只看数据科学的话,核心就是统计学,但实际工作里只会统计肯定还不够,还需要相当程度的领域知识。

                      所以正确的思路还是如何培养学习能力以及克服畏难心里吧。网络时代,成体系的知识都能查到,别把书读死了,就像陈平老师提倡的“要思维灵活,翻万卷书,不要皓首穷经,把脑袋读成wikipedia和别人的复读机了”【后半句我编的

                        7 个月 后

                        huangwu 大部分数学统计课本的编排都是一章套着另外一章,所以分离着去看每一章节简直是读天书。就像不理解前面随机变量的概念,怎么去理解随机变量序列的收敛特征呢?