Some HAT...

= Анабар.ru => Python-форумы => Язык программирования Python => сообщение 744
| Вход | Регистрация
нет
фото
Автор:  Anabar
Дата:  13-Dec-2005 23:25 (gmt = -3.0)

Что бы не было этой ошибки используйте utf-16 и заодно

не забывайте корректно записывать вторую строчку скрипта (см. педыдущий пост (739), а также документ http://www.python.org/peps/pep-0263.html ) . Т.о. ваш простой скрипт для чтения юникодовских файлов должен выглядеть примерно так

1  #!/usr/bin/env python
2  # -*- coding: koi8-r -*-
3  
4  inp_file=open('xian2.txt')
5  cur_line=unicode(inp_file.read(),'utf-16')
6  print cur_line.encode('koi8-r') 
А в скрипте 739 нужно сделать замену в строке номер восемь.

Что касается нахождения последовательностей, соответствующих регэкспу, то для это есть findall (см. предыдущий скрипт 739, строки 26 и 27). Стоит также почитать документацию по модулю re http://python.anabar.ru/help2.4/lib/mo...

Обращу внимание также на вашу стратегическую ошибку. Вы пытаетесь единовременно решить вообщем-то две разные проблемы — разобраться с регэкспами и разобраться с юникодом. Уместнее было бы разделить эти две задачи. Например, убедитесь сначала, что скрипт 739 работает для неюникодовских файлов, поэкперементируйте с регэкспами. Затем поковяряйтесь с приведëнным здесь кортким примером. И уже потом соединяйте знание.

На вопросы готов отвечать.

Удачи.



все сообщения ветви:

Недостаточно прав для написания ответа
Время генерации страницы в секундах: 0.096