用perl写一个关于两个文件对比的程序

老板非要写个perl程序处理两个文件,愁死了啊。
请各位大侠帮帮忙。
有两个文件 fileA
chr1 1111 A T
chr2 2222 G C
chr3 3333 G A
chr4 4444 A C
fileB:
chr1 1111 A T
chr2 2222 G A
chr3 3333 G A
chr4 5555 A C
程序需要实现的功能是 比较文件第二列,若相同则判断第三列和第四列,若也相同则将第二列第三列第四列的内容输入到文件A中;
若第四列不同则将fileA的第二列第三列第四列的内容输入到文件A1中,将fileB的第二列第三列第四列的内容输入到文件B1中;
若第二列不同则将fileA的第二列第三列第四列的内容输入到文件A2中,将fileB的第二列第三列第四列的内容输入到文件B2中;
真的跪求大侠能给一个完整的程序,万分感激。。。。
如第二列相同则比较此行的第三列和第四列。比如在上述例子fileA和fileB,我想得到的结果是:
文件A:chr3 3333 G A
文件A1:chr2 2222 G C
文件B1:chr2 2222 G A
文件A2:chr4 4444 A C
文件B2:chr4 5555 A C

给钱发工资么……

不考虑内存大小和文件大小的话,直接把A全读到内存做一个hash
然后一行一行读B不就可以比较了,比较的逻辑也有了……,就想直接求程序么……追问

是呢,我也想到用哈希,但是我perl实在是没接触过,程序又要得急,所以求程序呢,拜托啦~~~~

追答

#!/usr/bin/perl
use strict;
use warnings;

open FH,"fileA.txt" || die $!;

my %hash = ();
while(){
my @arr = split;
$hash{$arr[0]} = \@arr;
}
close FH;

open FH2,"fileB.txt" || die $!;
open FHA,">A" || die $!;
open FHA1,">A1" || die $!;
open FHB1,">B1" || die $!;
open FHA2,">A2" || die $!;
open FHB2,">B2" || die $!;
while(){
my @arr = split;
my @arrA = @{$hash{$arr[0]}};
if($arr[1] eq $arrA[1]){
if($arr[3] ne $arrA[3]){
print FHA1 join("\t", @arrA),"\n";
print FHB1 join("\t", @arr),"\n";
}elsif($arr[2] eq $arrA[2]){
print "@arr\n";
print FHA join("\t", @arrA),"\n";
}
}else{
print FHA2 join("\t", @arrA),"\n";
print FHB2 join("\t", @arr),"\n";
}
}

close FH2;
close FHA;
close FHA1;
close FHB1;
close FHA2;
close FHB2;

#代码写的有些丑陋,将就着用吧,有分就给补点分吧

温馨提示:答案为网友推荐,仅供参考
第1个回答  2012-10-24
用hash会打乱列内容的顺序哦
第2个回答  2012-10-25
第一列那个chr1是什么东西,还有文件A是不是少了一行,第一行的东西不也是都相同的吗?程序应该是不难编的,我想先把需求问清楚追问

对呢,第一行的东西也是放在A文件中,我给忽略了,不好意思呀~谢谢大侠~~

第3个回答  2012-10-24
这个问题很简单的 你建一个hash结构就可以了 $ha{chr3}{1111} -> [$i],判断fileB中时候存在(exist $ha{}{})就可以了追问

能具体点儿么?我真是perl盲。。