Fork me on GitHub
#clojure-russia
<
2017-10-27
>
anjensan08:10:20

@rustam.gilaztdinov а что из себя эти "логи" представляют?

anjensan09:10:53

есть знание/понимание откуда они приходит и как формируются?

anjensan09:10:54

предположу что это nginx

anjensan09:10:00

и это его логи

rustam.gilaztdinov09:10:07

да, все так, но я могу работать только с логами по факту то есть данные исторические и их надо отпроцессить

anjensan09:10:02

просто в таком случае у nginx есть настройка как форматировать логи... и было бы полезно ее знать 😉

rustam.gilaztdinov09:10:12

я немного по другую сторону баррикад — занимаюсь аналитикой, поэтому на данном этапе ничего поделать с этим не могу

anjensan09:10:58

а стоп. это походу вообще raw-запросы...

rustam.gilaztdinov09:10:46

сути не меняет, на самом деле. Данные только такие, и я решил поинтересоваться, есть ли простой способ их распарсить, а не городить очередной огород

anjensan09:10:16

еще как меняет

anjensan09:10:36

если есть raw-запрос... значит оно стандартизированно и существет 100500 готовых парсеров

rustam.gilaztdinov09:10:26

а можно хотя бы один?)

rustam.gilaztdinov09:10:05

да уж, в гугл отправили, спасибо

anjensan09:10:54

ну блиин...

anjensan09:10:26

если это аналитики точность не нужна - как уже говоирли регулярками

anjensan09:10:48

одной вырезать префикс, в нем урл, метод и HTTP/xxx (аля маркер)

igrishaev09:10:05

python http parser первая ссылка

anjensan09:10:11

второй вырезать список вида "BlaBla: something is here"

anjensan09:10:42

тут проблема судя по всему, что вместо концов строк в логах идут пробелы. т.е. в общем случае нельзя выделить отдельные хидеры

anjensan09:10:55

X: A Y: B - это 1 или 2 хидера

anjensan10:10:59

ибо, насколько я помню. : никак в хидере не экранируется

anjensan10:10:56

в общем если так (похерились \r\n) - тогда регулярочками. если нет - любой готовый парсер или релугярочками

ilevd10:10:06

@rustam.gilaztdinov покажи пример лога)

ilevd11:10:40

В серверах можно что-нибудь поискать и подергать)

ilevd11:10:58

Можно еще попробовать js библиотеку запустить в nashorn

misha14:10:22

я что-то пропустил, или ты так и не привел ниодного конкретного примера запроса? @rustam.gilaztdinov

misha14:10:52

что б хоть на глаз прикинуть чем попарсить было бы проще

rustam.gilaztdinov14:10:13

пропустил) судя по тому, что меня отправляют в гугол, я туповат, поэтому буду бодаться сам

misha14:10:45

а дай-ка ссылочку на сообщение или на гист

misha14:10:26

или ты показал/удалил?

rustam.gilaztdinov14:10:24

да, как-то потроха логов не хочу сильно светить. надеюсь, логгер этого слака не успел сдампить

misha14:10:26

ща гляну opieop

misha14:10:23

2017-10-21 - самое свежее

rustam.gilaztdinov14:10:42

да, тоже посмотрел)

misha13:10:59

@roman01la весело, вижу, было kappa

fmnoise19:10:49

да, ништяк, поговорили почему стоит писать на кложуре