hi
i have a file which is very large . it contains lines in the format below:
seed url, html url
....
...
seed url, html url
i have sort it already.
2010�Ϸ�����*_�����籩_������ �ż���ר��������24��Ļ��� ��������δ���Ž�_2010�Ϸ�����_�����籩_������
2010�Ϸ�����*_�����籩_������ �����뱴����˹������ Ī�*������������ʽ����_��������_2010�Ϸ�����_�����籩_������
2010�Ϸ�����*_�����籩_������ ר�ù������������������� �������ӽ�16ǿ__2010�Ϸ�����_�����籩_������
2010�Ϸ�����*_�����籩_������ �����Ը�Ů�Ѳ�������������� �뵽�й�������è(ͼ)_H��_2010�Ϸ�����*_�����籩_������
2010�Ϸ�����*_�����籩_������ �ƽ��裺���м����� ����*��ս���ڡ��Ƽ����ݡ�__2010�Ϸ�����*_�����籩_������
���ݷ��ز������Ż�_ס�ں�����_��*���Ӱ������������ý��_���ݷ�����,�����·�,����¥��,������,�����ⷿ,���س���,���ݶ��ַ���ѡ 70���г��� ��8�����ۻ����µ�-����-��*����-ס�ں���
���ݷ��ز������Ż�_ס�ں�����_��*���Ӱ������������ý��_���ݷ�����,�����·�,����¥��,������,�����ⷿ,���س���,���ݶ��ַ���ѡ 2010��6��11�ա�ס���ʱ���-�ʱ�-��*����-ס�ں���
���ݷ��ز������Ż�_ס�ں�����_��*���Ӱ������������ý��_���ݷ�����,�����·�,����¥��,������,�����ⷿ,���س���,���ݶ��ַ���ѡ �ⷿ�н��"��500��200" �г����ɷ����н�����ֶ�-�н��,�ⷿ-��*����-ס�ں���
���ݷ��ز������Ż�_ס�ں�����_��*���Ӱ������������ý��_���ݷ�����,�����·�,����¥��,������,�����ⷿ,���س���,���ݶ��ַ���ѡ 5�¾�����ݽ� ͨ�������Դ��Ϣ���ٴηŻ�--������-ס�ں���
���ݷ��ز������Ż�_ס�ں�����_��*���Ӱ������������ý��_���ݷ�����,�����·�,����¥��,������,�����ⷿ,���س���,���ݶ��ַ���ѡ ���������������� ��Ȩʽ�Ƶ���������� -�Ƶ�ʽ��Ԣ,����-��*����-ס�ں���
���ݷ��ز������Ż�_ס�ں�����_��*���Ӱ������������ý��_���ݷ�����,�����·�,����¥��,������,�����ⷿ,���س���,���ݶ��ַ���ѡ 5�·ݾ�����ݹ��� �������Ѽ۸�ͬ������3.1%--������-ס�ں���
now i want to get 3 htmlurl for each seedurl.
any tips will be appreciated.
---------- Post updated at 11:15 AM ---------- Previous update was at 11:11 AM ----------
hi
i have a file which is very large . it contains lines in the format below:
seedurl1, htmlur1
seedurl1, htmlurl2
....
seedurl1,htmlurln
.....
seedurlm,htmlurl1
seedurlm,htmlurl2
.....
seedurlm,htmlurln
......
now i want to get 3 htmlurl3 for each seedurl.
any tips will be appreciated.