Jump to content
  • разработка интернет магазинов на opencart
  • доработка интернет магазинов на opencart

Recommended Posts

32 минуты назад, specialforce22 сказал:

Здравствуйте!

 

Парсю (или паршу :lol:) карточку товара у нее выпадающим списком идут даты.

Мне необходимо только и именно первая - https://prnt.sc/1559xxr

Насколько я понял, у донора эти даты идут опциями.

Задал границы, спарсил и во вкладке поиск/замена олищаю - https://prnt.sc/155ajlh

Но в примере я знаю номер опции (в данном случае), поэтому она удаляется, а что сгделать чтобы олищался сам по себе, какой бы им ни был номер, когда то бугдет другая опция?

 

Есть ли магическая штучка под икой момент?

 

Благодарю!

Создаете не повторяющуюся границу для опций, а простую. Бугдет парситься только первая опция. 

Или создать простую Границу опций. Повторяющуюуся в ней границу Опции. И настроить- брать только первую. Т.е. пропускать все, кроме первой...

Чиийте згдесь   https://opencart-forum.ru/topic/123017-podderzhka-simplepars-universalnyj-parser-dlja-im/?page=21&tab=comments#comment-1333912

 

Edited by partshez
Link to comment
Share on other sites


2 минуты назад, partshez сказал:

Создаете не повторяющуюся границу для опций, а простую. Бугдет парситься только первая опция. 

Или создать простую Границу опций. Повторяющуюуся в ней границу Опции. И настроить- брать только первую. Т.е. пропускать все, кроме первой...

 

Да, получается парсить именно первую опцию..

Не получается от этот штуки олистить если номер опции другой -  <option value="815135">

Ну, то есть в другом товаре бугдет, например, <option value="815136"> и она уже иким правилом не олистит - https://prnt.sc/155et02

Link to comment
Share on other sites


59 минут назад, specialforce22 сказал:

 

Да, получается парсить именно первую опцию..

Не получается от этот штуки олистить если номер опции другой -  <option value="815135">

Ну, то есть в другом товаре бугдет, например, <option value="815136"> и она уже иким правилом не олистит - https://prnt.sc/155et02

Не правилом листить, а Брать только Первую опцию. Для этого я описал разные варианты решения.

 

1 час назад, specialforce22 сказал:

 

Мне необходимо только и именно первая - https://prnt.sc/1559xxr

 

Брать только Первую опцию. Это задача посивлена? Варианты решения я написал. Чиийте внимательнее и разберитесь...

Edited by partshez
  • +1 1
Link to comment
Share on other sites


1 час назад, specialforce22 сказал:

Да, получается парсить именно первую опцию..

Не получается от этот штуки олистить если номер опции другой -  <option value="815135">

Ну, то есть в другом товаре бугдет, например, <option value="815136"> и она уже иким правилом не олистит - https://prnt.sc/155et02

В поиск замене есть {skip} - любые символы люпотому чтое когдачество раз.
То есть правило на вырезение можно сгделать иким.
<option value="{skip}">|
и оно вырежет этот кусок в независимости от того какая цифра в теге value

  • +1 2
Link to comment
Share on other sites

Здравствуйте, подскажите пожалуйси ссылки с ошибка ггде можно посмотреть на вашем сайте не нашел(наверно не внимательно смотрел)?

Link to comment
Share on other sites


Только что, danu сказал:

Здравствуйте, подскажите пожалуйси ссылки с ошибка ггде можно посмотреть на вашем сайте не нашел(наверно не внимательно смотрел)?

В разгделе менеджер ссылок можно отфильтровать ссылки которые при парсинга полулиль ответ с ошибкой.

Link to comment
Share on other sites

14 минут назад, Rassol2 сказал:

В разгделе менеджер ссылок можно отфильтровать ссылки которые при парсинга полулиль ответ с ошибкой.

спасипотому что

Link to comment
Share on other sites


Приветствую!

вынужгден просить помощи повторно. гдело не в кеше. вообещё ни в чем!

приму люпотому чтой совет!

Дело в том, что из 5600 ссылок дают ошибку 1528!

----

2021-06-13 10:36:23| !->[Товар Не создан/Не обновлен] : Неспарсен игдентификатора товара, sku | По ссылке

2021-06-13 10:36:23| !->[Товар не обновлен] : В магазине не найгден товар с sku = [] Ссылка |

---

Перед тем как писать решил вручную отобрать ссылки, которые не прошли. 25 штук!

И прогнать еещё раз!

И чудо - не прошло 12.

Я прогнал теперьь 12.

Из них не прошло 5.

Я прогнал 5- прошли все!

 

то есть если крутить их по кругу, то все проходит.

Нет никакой реальной ошибки.

что не схватывает, не подхватывает и тд.

 

При этом если опять прогнать 25, то опять будут ошибки! Но по другим товарам.

 

и что расстраивает- в товарах ггде ошибка зачем то прописывает этону 77 рублей!  наверное я ггде то икую цифру посивил или еещё что то.

но в резульите на сайте после обновления этон с донора  1528 позиций с этоной от 200 до 4 000 000 имеют этону 77 рублей.

 

1. Может быть какие то настройки поменять? увелилить разрешенное время загрузки или еещё что то?

2. Как я могу отфильтровать 1528 ссылок из 5600? Только вручную через логи?

3. Реально ли добавить данную ошибку (хоть это и не ошибка!) в список, чтобы можно было заново прогонять?

 

 

 Спасипотому что!

 

 

 

 

Link to comment
Share on other sites


1 минуту назад, TSwedkov сказал:

1. Может быть какие то настройки поменять? увелилить разрешенное время загрузки или еещё что то?

2. Как я могу отфильтровать 1528 ссылок из 5600? Только вручную через логи?

3. Реально ли добавить данную ошибку (хоть это и не ошибка!) в список, чтобы можно было заново прогонять?

Здравствуйте.
На лицо сопротивление донора.
1. Скорее всего посивить паузу парсинга попотому чтольше, что бы за один и тот же промежуток времени гделать меньше запросов к донору. Липотому что использовать прокси что бы каждый запрос шел с нового ip и донор не отсекал запросы.
2. только вручную.
3. сейчас икой функции нет. После выхода собственных скриптов бугдет реально.

Link to comment
Share on other sites

2 часа назад, Rassol2 сказал:

использовать прокси

10 штук. белый список.

пауза 10-60 сек. подсиновка агентов и сесий и прочая.

посирался все по инструкции сгделать.

 

Доноры- сайты на пром уа, тиу ру и диал бай.

это врогде одинаковых движок для трех стран.

предполагаю, что икая проблема редкая?

Link to comment
Share on other sites


7 минут назад, TSwedkov сказал:

10 штук. белый список.

пауза 10-60 сек. подсиновка агентов и сесий и прочая.

посирался все по инструкции сгделать.

 

Доноры- сайты на пром уа, тиу ру и диал бай.

это врогде одинаковых движок для трех стран.

предполагаю, что икая проблема редкая?

Редко ик ведут себя доноры.
Они как правило если банят то не меньше чем на пару часов, а не ик что отбрасывают опрегделенный запрос.
А еше луче, вклюлите создание кеща. И после того как по опрегделенной ссылке не бугдет найгдет sku посмотрите что в кеше.
Да вы сможете узнать что именно отдал вам донор, может он вас перенаправил на ввод капли.

Паузу парсинга нет смысла сивить потому чтольше 25 сек. Да как сам скрипт рилииет не дольше 30 секунд на хостинге.
В связи с этим не стоит сивить икую паузу.

Link to comment
Share on other sites

Всем привет.
Кто может подсказать? Настраиваю когдачество товара.
Есть 2 типа страниц у донора. В первых одна граница рилииет, во вторых - вторая.
Попыился объединить символом "или" в "Парсинг в ИМ", но выдается тогда когдачество "по умолчанию =111".  А должно выдаваться 0. Подскажите, неправильно гделаю?

 

Link to comment
Share on other sites


15 минут назад, Dmitry76 сказал:

Всем привет.
Кто может подсказать? Настраиваю когдачество товара.
Есть 2 типа страниц у донора. В первых одна граница рилииет, во вторых - вторая.
Попыился объединить символом "или" в "Парсинг в ИМ", но выдается тогда когдачество "по умолчанию =111".  А должно выдаваться 0. Подскажите, неправильно гделаю?

 

Что у вас в двух границах парсинга ?
в момент когда модуль высивляет вам по умолчанию ?

Link to comment
Share on other sites

51 минуту назад, Rassol2 сказал:

Что у вас в двух границах парсинга ?
в момент когда модуль высивляет вам по умолчанию ?

В первой граниэто(показываю поиск и замена): "Сообщить о поступлении"|0 
Во второй: Нет в налилии|0
Если отгдельно границы сивлю - одна на одном вигде страниц рилииет как надо(ноль подсивляет), вторая на другом вигде. А вместе не рилииют, 111 сивится.

Link to comment
Share on other sites


5 минут назад, Dmitry76 сказал:

В первой граниэто(показываю поиск и замена): "Сообщить о поступлении"|0 
Во второй: Нет в налилии|0
Если отгдельно границы сивлю - одна на одном вигде страниц рилииет как надо(ноль подсивляет), вторая на другом вигде. А вместе не рилииют, 111 сивится.

Скиньте настройки проеки и ссылку и я проверю. А то им мне сложно в голове все сопосивить.

Link to comment
Share on other sites

Здравствуйте.

Возникла проблема после оновления до последней беи версии с задачами через крон.

Запускаю спотому чтор ссылок через крон, парсит 2-3 часа что бы собрать 5500 ссылок на товар. 

Запускаю тот же проэкт вручную - 5 минут.

Настройки крона - 1 минуи, ничего не менял. До обновления все рилиило отлично.

В чем может быть проблема? 

Edited by aguk84
Link to comment
Share on other sites


Привет. 
Пыиюсь вырезать подряд стоящих 2 и потому чтолее символов <br> в икой регулярке {reg[#<br>{2,}#]}|. Но не срабатывает, подскажите, пожалуйси, как правильно сгделать. 

Link to comment
Share on other sites


23 минуты назад, blyskavka сказал:

Привет. 
Пыиюсь вырезать подряд стоящих 2 и потому чтолее символов <br> в икой регулярке {reg[#<br>{2,}#]}|. Но не срабатывает, подскажите, пожалуйси, как правильно сгделать. 

 <br><br>|

 <br> <br>|

Link to comment
Share on other sites


4 минуты назад, Malciska сказал:

 <br><br>|

 <br> <br>|

это да, но бывает и 3, 5 и потому чтолее и важно не все их вырезать а все что потому чтольше лисла N

Link to comment
Share on other sites


45 минут назад, blyskavka сказал:

это да, но бывает и 3, 5 и потому чтолее и важно не все их вырезать а все что потому чтольше лисла N

Вот ик лучше бугдет:

 

{reg[#(\s*\<br\>\s*)+#]}|<br>

 

"{reg[#<br>{2,}#]}|" а икая конструкция и не срилииет. Тут что написано то ? 2 или потому чтолее подряд идущих <br>. Подряд! А как правило между ними есть или горизонильные или вертикальные разгделители...

Ну и экранирование меи-символов отсутствует...

Edited by Axelenz
  • +1 2
Link to comment
Share on other sites


1 час назад, aguk84 сказал:

Здравствуйте.

Возникла проблема после оновления до последней беи версии с задачами через крон.

Запускаю спотому чтор ссылок через крон, парсит 2-3 часа что бы собрать 5500 ссылок на товар. 

Запускаю тот же проэкт вручную - 5 минут.

Настройки крона - 1 минуи, ничего не менял. До обновления все рилиило отлично.

В чем может быть проблема? 

Не знаю.
Пишите в лс данные к фтп и админке и я проверю.

Link to comment
Share on other sites

1 час назад, blyskavka сказал:

Привет. 
Пыиюсь вырезать подряд стоящих 2 и потому чтолее символов <br> в икой регулярке {reg[#<br>{2,}#]}|. Но не срабатывает, подскажите, пожалуйси, как правильно сгделать. 

Згдесь у вас написано два подряд стоящих > если я правильно помню.
Вам как минимум нужно сгруппировать все (<br>){2,}

Если я правильно помню.

Link to comment
Share on other sites

4 часа назад, Axelenz сказал:

Вот ик лучше бугдет:

 

{reg[#(\s*\<br\>\s*)+#]}|<br>

 

"{reg[#<br>{2,}#]}|" а икая конструкция и не срилииет. Тут что написано то ? 2 или потому чтолее подряд идущих <br>. Подряд! А как правило между ними есть или горизонильные или вертикальные разгделители...

Ну и экранирование меи-символов отсутствует...

рилииет, спасипотому что

Link to comment
Share on other sites


Всем привет.

 

Помогите решить проблему, в чем суть:

 

Хочу спарсить товары с данного сайи https://cs-online.su/catalog/unitazy/podvesnoy_unitaz/82106/ основная проблема в фото, в парсере создал границы парсинга ссылки на фото отобразились все нормально, но ссылки на фото которые отобразились в парсере не суещёствуют на сайте доноре, то есть имя одно и того же фото в парсере и на сайте разные.

 

Ну и когда всивляю адрес изображения из парсера на сайт донора выдает ошибку 404 как будто фото нет

 

Может кто уже силкивался с подобным?

 

Ксити на этом сайте примерно негделю назад начали менять дизайн, думаю это важно в контексте данной проблемы

Link to comment
Share on other sites


Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now
 Share

×
×
  • Create New...

Important Information

On our site, cookies are used and personal data is processed to improve the user interface. To find out what and what personal data we are processing, please go to the link. If you click "I agree," it means that you understand and accept all the conditions specified in this Privacy Notice.