Если в файле присутствующие значения находятся в «или», разделенные значения

         "Name" "Tom" "CODE 041" "Has"
         "Address" "NSYSTEMS c/o" "First Term" "123" 18  
         "Occ" "Engineer" "Level1" "JT" 18

Как написать скрипт на python, чтобы получить все вышеперечисленные значения индивидуально

2
Hulk 22 Июн 2010 в 13:49

3 ответа

Лучший ответ

Ваш вопрос немного расплывчат, и в вашем примере нет запятых, поэтому сложно дать хороший ответ.

На вашем примере файл, содержащий

"Name" "Tom" "CODE 041" "Has"
"Address" "NSYSTEMS c/o" "First Term" "123" 18  
"Occ" "Engineer" "Level1" "JT" 18

Этот скрипт

import csv
reader = csv.reader(open('test.txt'), delimiter=' ', quotechar='"')
for row in reader:
    print(row)

Производит

['Name', 'Tom', 'CODE 041', 'Has']
['Address', 'NSYSTEMS c/o', 'First Term', '123', '18']
['Occ', 'Engineer', 'Level1', 'JT', '18']

Это предполагает, что разделитель между значениями является пробелом. Если это вкладка, используйте delimiter='\t'.

Вам не повезло с таким подходом, если разделители меняются по всему файлу - в этом случае они больше не являются допустимыми файлами CSV / TSV. Но все это лишь предположение, пока вы не предоставите несколько реальных и актуальных примеров данных, которые вы хотите проанализировать.

3
Tim Pietzcker 22 Июн 2010 в 10:55

Используйте модуль CSV, он будет правильно обрабатывать все типы разделителей и кавычек, написание такого кода с использованием split и т. Д. Не является тривиальным

import csv
import StringIO

data = '''"Name" "Tom" "CODE 041" "Has"
"Address" "NSYSTEMS c/o" "First Term" "123" 18  
"Occ" "Engineer" "Level1" "JT" 18"
'''

reader = csv.reader(StringIO.StringIO(data), delimiter=' ')
for row in reader:
    print row

Выход:

['Name', 'Tom', 'CODE 041', 'Has']
['Address', 'NSYSTEMS c/o', 'First Term', '123', '18']
['Occ', 'Engineer', 'Level1', 'JT', '18']
0
Anurag Uniyal 22 Июн 2010 в 10:06

Альтернативный подход к использованию CSV Reader.

< Сильный > in.txt

"Name" "Tom" "CODE 041" "Has"
"Address" "NSYSTEMS c/o" "First Term" "123" 18  
"Occ" "Engineer" "Level1" "JT" 18

< Сильный > parse.py

for i in [line.split('"') for line in open("in.txt")]: # split on the separator
    for j in i: # for each token in the split string
        if len(j.strip())>0: # ignore empty string, like the spaces between elements
            print j.strip()

< Сильный > out.txt

Name
Tom
CODE 041
Has
Address
NSYSTEMS c/o
First Term
123
18
Occ
Engineer
Level1
JT
18

Но я бы назвал ваши ценности " enclosed. И я не вижу никаких , separated. Не могли бы вы расширить свои тестовые данные? Покажите несколько строк с разделенными значениями, и я раскрою мой код.

1
Mizipzor 22 Июн 2010 в 10:11