`Some HAT...`

= Анабар.ru => Python-форумы => Язык программирования Python => сообщение 744

нет
фото

Автор: Anabar

Дата: 13-Dec-2005 23:25 (gmt = -3.0)
Что бы не было этой ошибки используйте utf-16 и заодно

не забывайте корректно записывать вторую строчку скрипта (см. педыдущий пост (739), а также документ http://www.python.org/peps/pep-0263.html ) . Т.о. ваш простой скрипт для чтения юникодовских файлов должен выглядеть примерно так
1 #!/usr/bin/env python 2 # -*- coding: koi8-r -*- 3 4 inp_file=open('xian2.txt') 5 cur_line=unicode(inp_file.read(),'utf-16') 6 print cur_line.encode('koi8-r')
А в скрипте 739 нужно сделать замену в строке номер восемь.

Что касается нахождения последовательностей, соответствующих регэкспу, то для это есть findall (см. предыдущий скрипт 739, строки 26 и 27). Стоит также почитать документацию по модулю re http://python.anabar.ru/help2.4/lib/mo...

Обращу внимание также на вашу стратегическую ошибку. Вы пытаетесь единовременно решить вообщем-то две разные проблемы — разобраться с регэкспами и разобраться с юникодом. Уместнее было бы разделить эти две задачи. Например, убедитесь сначала, что скрипт 739 работает для неюникодовских файлов, поэкперементируйте с регэкспами. Затем поковяряйтесь с приведëнным здесь кортким примером. И уже потом соединяйте знание.

На вопросы готов отвечать.

Удачи.
все сообщения ветви:

733 Регэкспы и Юникод  Dirk Diggler  | 5-Dec-2005, 22:09 | просмотров: 4136

739 А какая именно цель? Найти первое вхождение или все?  Anabar  | 9-Dec-2005, 13:31 | просмотров: 3942

741 Цель была заставить регэкспы заработать. 8-) (+)  Dirk Diggler  | 10-Dec-2005, 21:51 | просмотров: 3894

744 Что бы не было этой ошибки используйте utf-16 и заодно  Anabar  | 13-Dec-2005, 23:25 | просмотров: 4134    ⇐ ◄

755 заработало, но не могу составить регэксп  Dirk Diggler  | 4-Jan-2006, 14:45 | просмотров: 4238

Недостаточно прав для написания ответа

Время генерации страницы в секундах: 0.096