maridena писал(а):
... Но что делать если источники противоречат друг-другу буквально в 70% случаев.
Это получается адова работа - понять кто прав, кто виноват и т.п.
.... Вижу варианты:
1. Все-таки держать список "противоречивых" марок и дать пользователю гору различий, пусть сам решает
2. Придать разный "вес" разным источникам, т.е., например, у викифилателии авторитета больше чем у онлайн-коллекции Васи пупкина, стало быть мы сохраняем данные из викифилателии, а инфу тов. Пупкина перетираем.
3. ???
Есть какие-то соображения, господа?
Я верю, что программеры могут все...
Но не понимаю, как...
Противоречия могут возникнуть по причине:
- банальная ошибка (описка)
- недостаток официальной информации
- принципы каталогизации у составителей разных каталогов могут различаться
- составитель (условно) Михель может получить инфу, которую сочтет достоверной, а составитель Скотт - такой инфой не располагает...
- что-то еще...
Мне не понятно, каким образом программа в автомате может выявить, что в Михеле под номером 1350 и в Скотте под номером 1420 речь идет об одной и той же марке? Если и в названии марки на английском и на немецком - могут быть "разночтения"...
Тем более непонятно, по каким критериям программа будет определять какому источнику дать приоритет.
В общем: по маркам США - приоритет Скотту, по маркам Германии - приоритет Михелю, по маркам России - российскому каталогу...
Но это в общем и целом... а не в конкретном случае.
Когда обсуждалось, я имел ввиду, что если у меня есть информация о выпуске, и эта информация содержит номер по Михелю и по Скотту, и я получу от кого-то инфу, содержащую номер по Скотту и (или) Михелю - то программа может сравнить номера, выявить записи, содержащие одинаковые номера по Скотту, и по этим записям сравнить значения по всем полям - и показать мне (выделить цветом, допустим) те поля, в которых записи не одинаковые.
А дальше я не представляю... Этого мне достаточно "для счастья".
Анализ ( в конце концов, для машины РАЗНЫЕ ЗНАЧЕНИЯ могут заключаться только в том, что в одной из них имеется лишний пробел...) - это я сам должен делать...
Мое мнение - никаких приоритетов "в общем" быть не должно. в конце концов, если пользователь не считает нужным заморачиваться, и уверен, что его запись - правильная, а "пришлая" - неправильная, он может не особо переживая и не вникая ВРУЧНУЮ УДАЛИТЬ ТУ, КОТОРАЯ ЕГО НЕ УСТРАИВАЕТ
Но если он желает докопаться, в чем причина "разночтений" - машина не должна лишать его этого удовольствия.
ИМХО, конечно.