Saturday, August 22, 2015

Get bibliography to work with Markdown, LaTeX and MS Word

I am a fun of Google, Markdown, LaTeX, but I have to work with people who are using MS Word.

1. Work with Markdown

To cut it short, I first download citations from Google Scholar (use the “Import to BibTex” option), save it as text. But I will modify it with Markdown syntax. Particularly, I use * for italics, which is veeeeery handy. Also I will correct some other obvious mistakes in this step.

2. Work with LaTeX

Then I will use customized Perl script to convert this Markdown-Bibtex hybrid text into pure BibTex with formatBibli.pl. This script will take in two argument, the other is journalAbbrev database which is also customized for any kind of journal output, all flexibility can be realized through updating this script.

3. Work with MS Word

The reason why I surrender to MS Word is:
1. Too many of my colleges are using it;
2. The “revision” function is very impressive in Word;
3. The output style in Endnote is really impressive, it saves me a lot of time, this is the killing reason that makes me to do the final touch of citing papers in MS Word with Endnote.

So for now, the whole point is how to convert from *.bib to endnote. As I just learned that only Endnote xml file could fully encapsulate all elements of a citation item and work very well with Endnote. Other formats such as *.txt or *.ris does not, because they just cannot import the italics, bold or other important modification of fonts into Endnote. If they do not do this, you will have to do everything by yourself in Endnote manually, which is very tedious. Luckily, we have bib2endnote by Trent Apted. It can convert *.bib to Endnote xml easily.

4. My workflow

  1. Writing papers in Markdown: when a citation come across, I will just use (citation someRandomInfomation) there;
  2. When the paper is finished, I will get serious about the citations, I will go to find the citations I meant in the first writing. I will then prepare a *.bib file especially for this document following these steps:
    a. find the citated paper in mybiblio file, if exists, copy it to the new bib file;
    b. if does not exists, go to Google Scholar, find it, correct.
    c. Once put an item into the new bib file, I will change the “citation someRandomInfomation” to the “cite citationKey”, which is ready to be recognized by LaTeX.
    d. Keep correcting for this new bib file, until everything looks correct.
    e. Use a “updateBibli.pl” script to update mybiblio, the point of this script is taking all items in the new bibli, and integrate all other items in the old biblio, so that every modification will be integrated into mybibli which will serve as a permanent bank.

  3. Run the formatBibli.pl to convert hybrid format into bib format, if neccessary, I will compile the document into a pdf with LaTeX. If I do not want bibliography to be compiled in PDF and lost the citationKey, I will this substitute “cite” into “citation” in markdown, so it will not be converted.

  4. Convert PDF to Word with Adobe Acrobat.

  5. Some adjustment of page setting with Word.

  6. Convert bib file into Endnote XML file and import it into Endnote.

  7. Citation in Word.

Saturday, July 26, 2014

加勒比:男的杀光,女的留下

今天读文献,读着读着,脆弱的玻璃心又被狠狠伤了一回。这篇文章标题是《重构加勒比地区群体遗传历史》,研究的是加勒比地区的人群结构。

背景知识:从地图上看,在北美和南美两块大陆之间,我们看到一大片海域,靠近北美的一大片,是墨西哥湾,靠近南美的这一片,是加勒比海。所谓的加勒比地区就是包括加勒比海以及环绕这个海域的一些小国家。仅看地图,我们就知道这个地方有多重要,简直就是联系南北大陆的咽喉。虽然此地的人类文明很短,但也是个纷争之地,或人来人往,车马辐辏,或者梓泽丘墟,血腥弥漫。闲话少叙,单说此地的人种。此地人种主要有三大血缘。第一种血缘就是美洲土著;而后来随着哥伦布发现新大陆,于是有了第二种血缘输入:欧洲人血缘;同时,欧洲人为了找人当苦力,于是贩运了大批非洲人,引入了第三大血缘,非洲血缘。如果单看此地现在人们身上的血缘,可以看做是由以上三股混合而成。

图1. 美洲地图之加勒比地区的位置
回到这个研究吧,作者采用了全基因组的分子标记,去鉴定这一地区的人类血缘。看图2:上方的那个图就是全基因组(常染色体)的结果,这些颜色色块,你可以看成血液的颜色,其中红色是欧洲血缘,蓝色是美洲土著血缘,绿色是非洲血缘。然后按照地区排列,从左到右,依次是古巴、海地、多米尼亚、波多黎各、哥伦比亚、洪都拉斯和墨西哥。每个国家的人种血缘一目了然。总体来看,这一地区,主要血缘来自欧洲,其次美洲土著,非洲血缘最少。不同的国家又有差异,比如海地、多米尼亚以及古巴是欧洲人和非洲人的混血;而其他几个国家可看成是美洲土著和欧洲人的混血。虽然大致这样说,但是实际上几乎每个人或多或少都已经混杂了三种人的血。

图2. 加勒比人群血缘构成
如果你爱作历史的想象,那就想象一下吧:哥伦布发现新大陆,也就是500年前,此地如果画同样一张图,那应该是一片蓝色,对不?红色和绿色是后来才混进来的。到了现在,红色已经占据了主导。红色是怎么占据主导的?一方面,干掉蓝色,另一方面,拼命扩增自己。我就说一说颜色打架就好了,具体如果说出来,恐怕吓坏了小伙伴。比如绝育,比如用细菌病毒撂倒整个地区的人,比如背着一把小手枪进村,对着那些simple&naive的面孔,杀几个人玩。
图2的故事只讲了一半,刚才只看了上面的图,我们现在再看下面。下面的图,是用X染色体标记画的图。X染色体,在男性和女性的基因组内,数量是不一样的。男性只有一条,女性有两条。所以从某种意义上讲,X染色体可以视为女性化程度的一个标记。OK,有了这个背景,请再看下面的图,你发现了什么?蓝色变多了,红色变少了!不劳你费眼神看,作者已经统计好了结果(图3)。三种血缘,每个有两个结果,左边是全基因组(常染色体),右边是X染色体。这下更明显了:欧洲人总体血缘很多,女性血缘很少;非洲人两种血缘都很少,但是女性血缘较高;美洲土著总体血缘很少,但是女性血缘很高!啊哈!

图3. 加勒比地区常染色体和X染色体血缘构成
我们上文分析了这一地区的血缘更替,是“颜色的战争”,以及那些吓坏小伙伴的历史。但是这张图让我们更仔细地看到了这场“颜色战争”更细节的一面。从图3看,目前加勒比地区,总体的血缘,欧洲占到60%以上,美洲土著只有不到20%. 但是就女性血缘来说,欧洲只有30%,美洲土著超过了40%. 让我再来点想象吧:当初哥伦布发现新大陆以后,大批欧洲人来到美洲,有的举家迁移,有的只是独身一人来碰运气(更可能是男性)。然后就有“颜色战争”,但是在“颜色战争”中,女性的存活率是高于男性的,因为她们的血缘更多地传递到了如今。个中细节,需要你丰富的想象,因为历史往往超出你最大胆的想象。
有人问:那对于弱势文明,都是这么残酷吗?现实会不会美好一点。女性扮演的角色真的这样没节操吗?我们还真的可以从好的一方面去看:以美洲人来看,他们女性血缘这么高,甚至可以猜想(当然,需要更细致的定量研究),总体的那点美洲血缘是不是都是由女性给保留下来的?如果不是女性的角色,恐怕放眼现今加勒比的总体血缘,只会是一片红色的世界了吧?嗯,女性还是功不可没!但,是否就此乐观呢?说:“女性会替我们保留着血脉呢!”,非也非也,一切都是暂时的。只要欧洲文明继续强势,那么适应这种文明的血缘成分会不断扩增,当然,这个血缘是红色。只要时间推移,可以预计,整体的基因组成分,美洲人的成分会被洗刷干净(即使洗不干净,那也只会留下很小很小的一部分,那些有利于适应美洲环境的血缘)!但是X染色体的血缘则不会,他们会是稳定的,一直飘荡在这个基因池里面。所以女性对于总体血缘的保存,只是缓冲器的作用,却不能对最终结果产生影响。
有人问:你说的这样的砍呀杀呀,好血腥哦,有没有温柔点的?也有。来美国之前,某同学微博上感叹:在美国看到的一把一把的白人男性和亚裔女性的couple,呆了一年也没看到一对相反的情况!嗯,我来美国望了一眼,确实不假。我还在实验室抛出这个难题,供诸小伙伴讨论了一下,他们也表示呵呵。嗯,是的,文明的更迭,从一段浪漫的异国恋开始……打住打住,再聊下去,就由科普变成脑洞大开,走上歪路了。
只是,咳咳,都说人艰不拆是美德,我这样拆穿,真的好吗?