Configurar el autonomy

Per defecte l'Autonomy ve activat. Al log ha de sortir:

Starting linux-intel/IDOLserver/DiSH/AutonomyDiSH.exe
Autonomy engine started.

-------------------------------------------------------------------------
RUTA de l'Autonomy:
windows --> C:\beaHome\wlserver_10.0\cm\thirdparty\autonomy-wlp10\win32
linux --> bea/wlp1001/wlserver_10.0/cm/thirdparty/autonomy-wlp10/linux-intel
-------------------------------------------------------------------------

IMPORTANT: per defecte només permet queries des de localhost.
Per acceptar queries de màquines remotes, afegir a l'arxiu
C:\beaHome\wlserver_10.0\cm\thirdparty\autonomy-wlp10\win32\IDOLserver\IDOL
IDOLserver/IDOL/AutonomyIDOLServer.cfg:

[Server]
ExplicitHost=10.94.110.56 (ip de la màquina, no localhost)
Host=10.94.110.56 (ip de la màquina, no localhost)
...
QueryClients=*.*.*.* (o ips concretes)
...

-------------------------------------------------------------------------

El següent pas és configurar l'IDOL Server per tal que utilitzi el
connector HTTPFetch.

1.- Configurar un Spider (AUTONOMY_PATH/HTTPFetch/HTTPFetch.cfg)
[DEFAULT]
...
SPIDERREPEATSECS=300 (cada quan es dispara)
SPIDERCYCLES=-1 (repetir sempre)
DEPTH=5 (produnfitat a seguir, en aquest cas pàgines
fins a 5 enllaços de l'inici)
IMPORTSTRIPLINKS=false (si està a true, no indexem cap enllaç)

[SPIDER]
IMPORTPATH=../HTTPFetch
INDEXPATH=../HTTPFetch
NUMBER=1 (augmentar el número d'spiders)
0=MYOWNSPIDER (posar-li un nom a l'spider)

[MYOWNSPIDER]
URL=http://localhost:7001/aca/appmanager/acaPortal/web
Directory=MYOWNSPIDER (directori on volem que deixi els arxius)
Log file=myownspider.log
StayOnSite=true (per a no sortir del portal, no seguir enllaços externs)
ImportFieldOp0=EliminateBetweenChars
ImportFieldOpApplyTo0=DREREFERENCE
ImportFieldOpParam0=;,?,1,0
ImportFieldOpCheckField0=DREREFERENCE
ImportFieldOpCheckValue0=*jsessionid* (permet treure el jsession del camp DREREFERENCE evitant pàgines repetides)
ImportConvertHTMLToUTF8=true
Extensions=*.htm,*.html,*.jsp


http://localhost:9014/action=List -- Para ver la lista de indexaciones
http://localhost:9014/action=Help -- Para ver los comandos que se pueden usar
Con el comando Query podemos hacer búsquedas

Agradecimientos a Javier Querol por su colaboración

0 comentarios: