File CrossRef.java

Branches:

184

Statements:

288

Methods:

Classes:

LOC:

1,110

NCLOC:

649

Total complexity:

137

Complexity density:

0.48

Statements/Method:

Methods/Class:

Average method complexity:

8.56

Classes

Class	Line #	Total Statements	Complexity	TOTAL Coverage	Actions
CrossRef	47	288	137	0.4631147746.3%

Class CrossRef

Class CrossRef	Line # 47	Total Statements 288	Complexity 137	TOTAL Coverage 0.4631147746.3%
CrossRef(SequenceI[],AlignmentI) CrossRef(SequenceI[],AlignmentI)	8080	2.02	2.02	0.75 0.7575%
findXrefSourcesForSequences(boolean) : List<String> findXrefSourcesForSequences(boolean) : List<String>	100100	9.09	3.03	0.9230769 0.923076992.3%
findXrefSourcesForSequence(SequenceI,boolean,List<String>) : void findXrefSourcesForSequence(SequenceI,boolean,List<String>) : void	140140	9.09	2.02	0.90909094 0.9090909490.9%
addXrefsToSources(List<DBRefEntry>,List<String>) : void addXrefsToSources(List<DBRefEntry>,List<String>) : void	181181	5.05	3.03	1.0 1.0100%
findXrefSequences(String,boolean) : Alignment findXrefSequences(String,boolean) : Alignment	218218	58.058	31.031	0.82 0.8282%
retrieveCrossRef(List<DBRefEntry>,SequenceI,List<DBRefEntry>,boolean,AlignedCodonFrame) : void retrieveCrossRef(List<DBRefEntry>,SequenceI,List<DBRefEntry>,boolean,AlignedCodonFrame) : void	402402	25.025	10.010	0.0 0.00%
removeAlreadyRetrievedSeqs(List<DBRefEntry>,boolean) : void removeAlreadyRetrievedSeqs(List<DBRefEntry>,boolean) : void	483483	16.016	6.06	0.0 0.00%
equals(Object) : boolean equals(Object) : boolean	641641	1.01	1.01	0.0 0.00%
importCrossRefSeq(AlignedCodonFrame,List<SequenceI>,List<SequenceI>,SequenceI,SequenceI) : boolean importCrossRefSeq(AlignedCodonFrame,List<SequenceI>,List<SequenceI>,SequenceI,SequenceI) : boolean	526526	47.047	16.016	0.0 0.00%
setReverseMapping(SequenceI,DBRefEntry,AlignedCodonFrame) : void setReverseMapping(SequenceI,DBRefEntry,AlignedCodonFrame) : void	685685	12.012	6.06	0.0 0.00%
findInDataset(DBRefEntry) : SequenceI findInDataset(DBRefEntry) : SequenceI	724724	18.018	13.013	0.7 0.770%
sameSequence(SequenceI,SequenceI) : boolean sameSequence(SequenceI,SequenceI) : boolean	783783	12.012	9.09	0.90909094 0.9090909490.9%
updateDbrefMappings(SequenceI,List<DBRefEntry>,SequenceI[],AlignedCodonFrame,boolean) : void updateDbrefMappings(SequenceI,List<DBRefEntry>,SequenceI[],AlignedCodonFrame,boolean) : void	823823	9.09	3.03	0.0 0.00%
constructMapping(SequenceI,SequenceI,DBRefEntry,AlignedCodonFrame,boolean) : boolean constructMapping(SequenceI,SequenceI,DBRefEntry,AlignedCodonFrame,boolean) : boolean	866866	24.024	12.012	0.0 0.00%
searchDatasetXrefs(boolean,SequenceI,List<DBRefEntry>,List<SequenceI>,AlignedCodonFrame) : boolean searchDatasetXrefs(boolean,SequenceI,List<DBRefEntry>,List<SequenceI>,AlignedCodonFrame) : boolean	956956	6.06	3.03	1.0 1.0100%
searchDataset(boolean,SequenceI,DBRefEntry,List<SequenceI>,AlignedCodonFrame,boolean,int) : boolean searchDataset(boolean,SequenceI,DBRefEntry,List<SequenceI>,AlignedCodonFrame,boolean,int) : boolean	10061006	35.035	17.017	0.8196721 0.819672182%

Contributing tests

This file is covered by 101 tests. .

Contributing tests

Test contribution	Test	Result
0.34836066	jalview.io.CrossRef2xmlTests.openCrossrefsForEnsemblTwicejalview.io.CrossRef2xmlTests.openCrossrefsForEnsemblTwice	1PASS
0.1659836	jalview.analysis.CrossRefTest.testFindXrefSequences_fromDbRefMapjalview.analysis.CrossRefTest.testFindXrefSequences_fromDbRefMap	1PASS
0.16188525	jalview.analysis.CrossRefTest.testFindXrefSequences_indirectDbrefToProteinjalview.analysis.CrossRefTest.testFindXrefSequences_indirectDbrefToProtein	1PASS
0.16188525	jalview.analysis.CrossRefTest.testFindXrefSequences_indirectDbrefToNucleotidejalview.analysis.CrossRefTest.testFindXrefSequences_indirectDbrefToNucleotide	1PASS
0.13934426	jalview.project.Jalview2xmlTests.testStoreAndRecoverGeneLocusjalview.project.Jalview2xmlTests.testStoreAndRecoverGeneLocus	1PASS
0.13729508	jalview.analysis.CrossRefTest.testFindXrefSourcesForSequence_proteinToDnajalview.analysis.CrossRefTest.testFindXrefSourcesForSequence_proteinToDna	1PASS
0.12704918	jalview.project.Jalview2xmlTests.testRNAStructureRecoveryjalview.project.Jalview2xmlTests.testRNAStructureRecovery	1PASS
0.12295082	jalview.project.Jalview2xmlTests.testCopyViewSettingsjalview.project.Jalview2xmlTests.testCopyViewSettings	1PASS
0.12295082	jalview.project.Jalview2xmlTests.viewRefPdbAnnotationjalview.project.Jalview2xmlTests.viewRefPdbAnnotation	1PASS
0.12295082	jalview.project.Jalview2xmlTests.testStoreAndRecoverExpandedviewsjalview.project.Jalview2xmlTests.testStoreAndRecoverExpandedviews	1PASS
0.12295082	jalview.project.Jalview2xmlTests.noDuplicatePdbMappingsMadejalview.project.Jalview2xmlTests.noDuplicatePdbMappingsMade	1PASS
0.12295082	jalview.project.Jalview2xmlTests.testStoreAndRecoverReferenceSeqSettingsjalview.project.Jalview2xmlTests.testStoreAndRecoverReferenceSeqSettings	1PASS
0.12295082	jalview.project.Jalview2xmlTests.gatherViewsHerejalview.project.Jalview2xmlTests.gatherViewsHere	1PASS
0.1045082	jalview.analysis.CrossRefTest.testSearchDatasetjalview.analysis.CrossRefTest.testSearchDataset	1PASS
0.06967213	jalview.renderer.seqfeatures.FeatureRendererTest.testFindComplementFeaturesAtResiduejalview.renderer.seqfeatures.FeatureRendererTest.testFindComplementFeaturesAtResidue	1PASS
0.06762295	jalview.gui.AlignViewportTest.testDeregisterMapping_onCloseViewjalview.gui.AlignViewportTest.testDeregisterMapping_onCloseView	1PASS
0.06762295	jalview.io.vcf.VCFLoaderTest.testDoLoad_vepCsqjalview.io.vcf.VCFLoaderTest.testDoLoad_vepCsq	1PASS
0.06762295	jalview.schemes.ClustalxColourSchemeTest.testFindColour_ignoreGapsjalview.schemes.ClustalxColourSchemeTest.testFindColour_ignoreGaps	1PASS
0.06762295	jalview.io.vcf.VCFLoaderTest.testDoLoad_reverseStrandjalview.io.vcf.VCFLoaderTest.testDoLoad_reverseStrand	1PASS
0.06762295	jalview.analysis.scoremodels.FeatureDistanceModelTest.testFindFeatureAt_PointFeaturejalview.analysis.scoremodels.FeatureDistanceModelTest.testFindFeatureAt_PointFeature	1PASS
0.06762295	jalview.io.vcf.VCFLoaderTest.testDoLoadjalview.io.vcf.VCFLoaderTest.testDoLoad	1PASS
0.06762295	jalview.gui.ColourMenuHelperTest.testAddMenuItems_nucleotidejalview.gui.ColourMenuHelperTest.testAddMenuItems_nucleotide	1PASS
0.06352459	jalview.renderer.seqfeatures.FeatureRendererTest.testFindFeaturesAtColumnjalview.renderer.seqfeatures.FeatureRendererTest.testFindFeaturesAtColumn	1PASS
0.06352459	jalview.schemes.ClustalxColourSchemeTest.testFindColourjalview.schemes.ClustalxColourSchemeTest.testFindColour	1PASS
0.06352459	jalview.io.AnnotatedPDBFileInputTest.testJalviewProjectRelocationAnnotationjalview.io.AnnotatedPDBFileInputTest.testJalviewProjectRelocationAnnotation	1PASS
0.06352459	jalview.gui.AlignViewportTest.testGetConsensusSeqjalview.gui.AlignViewportTest.testGetConsensusSeq	1PASS
0.06352459	jalview.datamodel.AlignmentViewTest.testGetVisibleContigsjalview.datamodel.AlignmentViewTest.testGetVisibleContigs	1PASS
0.06352459	jalview.gui.SeqPanelTest.testFindColumn_unwrappedjalview.gui.SeqPanelTest.testFindColumn_unwrapped	1PASS
0.06352459	jalview.gui.SeqPanelTest.testAmbiguousAminoAcidGetsStatusMessagejalview.gui.SeqPanelTest.testAmbiguousAminoAcidGetsStatusMessage	1PASS
0.06352459	jalview.project.Jalview2xmlTests.testMergeDatasetsforManyViewsjalview.project.Jalview2xmlTests.testMergeDatasetsforManyViews	1PASS
0.06352459	jalview.ext.jmol.JmolViewerTest.testAddStrToSingleSeqViewJMoljalview.ext.jmol.JmolViewerTest.testAddStrToSingleSeqViewJMol	1PASS
0.06352459	jalview.project.Jalview2xmlTests.testStoreAndRecoverPDBEntryjalview.project.Jalview2xmlTests.testStoreAndRecoverPDBEntry	1PASS
0.06352459	jalview.analysis.scoremodels.FeatureDistanceModelTest.testFindDistancesjalview.analysis.scoremodels.FeatureDistanceModelTest.testFindDistances	1PASS
0.06352459	jalview.gui.ScalePanelTest.testPreventNegativeStartColumnjalview.gui.ScalePanelTest.testPreventNegativeStartColumn	1PASS
0.06352459	jalview.io.JalviewExportPropertiesTests.testImportExportPeriodGapsjalview.io.JalviewExportPropertiesTests.testImportExportPeriodGaps	1PASS
0.06352459	jalview.schemes.PIDColourSchemeTest.testFindColour_ignoreGapsjalview.schemes.PIDColourSchemeTest.testFindColour_ignoreGaps	1PASS
0.06352459	jalview.gui.AlignViewportTest.testDeregisterMapping_withReferencejalview.gui.AlignViewportTest.testDeregisterMapping_withReference	1PASS
0.06352459	jalview.io.BackupFilesTest.backupsEnabledNoRollMaxTestjalview.io.BackupFilesTest.backupsEnabledNoRollMaxTest	1PASS
0.06352459	jalview.io.FeaturesFileTest.testParse_mixedJalviewGffjalview.io.FeaturesFileTest.testParse_mixedJalviewGff	1PASS
0.06352459	jalview.io.FeaturesFileTest.testParsejalview.io.FeaturesFileTest.testParse	1PASS
0.06352459	jalview.gui.PairwiseAlignmentPanelTest.testConstructor_noSelectionGroupjalview.gui.PairwiseAlignmentPanelTest.testConstructor_noSelectionGroup	1PASS
0.06352459	jalview.project.Jalview2xmlTests.testStoreAndRecoverGroupRepSeqsjalview.project.Jalview2xmlTests.testStoreAndRecoverGroupRepSeqs	1PASS
0.06352459	jalview.gui.ScalePanelTest.testSelectColumns_withHiddenjalview.gui.ScalePanelTest.testSelectColumns_withHidden	1PASS
0.06352459	jalview.gui.SeqPanelTest.testFindMousePosition_wrapped_noAnnotationsjalview.gui.SeqPanelTest.testFindMousePosition_wrapped_noAnnotations	1PASS
0.06352459	jalview.gui.SeqPanelTest.testSetStatusReturnsNearestResiduePositionjalview.gui.SeqPanelTest.testSetStatusReturnsNearestResiduePosition	1PASS
0.06352459	jalview.project.Jalview2xmlTests.testPcaViewAssociationjalview.project.Jalview2xmlTests.testPcaViewAssociation	1PASS
0.06352459	jalview.gui.AlignViewportTest.testDeregisterMapping_withNoReferencejalview.gui.AlignViewportTest.testDeregisterMapping_withNoReference	1PASS
0.06352459	jalview.gui.AlignFrameTest.testNewView_colourThresholdsjalview.gui.AlignFrameTest.testNewView_colourThresholds	1PASS
0.06352459	jalview.project.Jalview2xmlTests.testSaveLoadFeatureColoursAndFiltersjalview.project.Jalview2xmlTests.testSaveLoadFeatureColoursAndFilters	1PASS
0.06352459	jalview.io.FeaturesFileTest.simpleGff3FileLoaderjalview.io.FeaturesFileTest.simpleGff3FileLoader	1PASS
0.06352459	jalview.gui.PairwiseAlignmentPanelTest.testConstructor_withSelectionGroupjalview.gui.PairwiseAlignmentPanelTest.testConstructor_withSelectionGroup	1PASS
0.06352459	jalview.gui.SeqPanelTest.testFindColumn_wrappedjalview.gui.SeqPanelTest.testFindColumn_wrapped	1PASS
0.06352459	jalview.gui.SeqPanelTest.testFindMousePosition_wrapped_annotationsjalview.gui.SeqPanelTest.testFindMousePosition_wrapped_annotations	1PASS
0.06352459	jalview.gui.ScalePanelTest.testBuildPopupMenujalview.gui.ScalePanelTest.testBuildPopupMenu	1PASS
0.06352459	jalview.analysis.scoremodels.FeatureDistanceModelTest.testFeatureScoreModel_HiddenColumnsjalview.analysis.scoremodels.FeatureDistanceModelTest.testFeatureScoreModel_HiddenColumns	1PASS
0.06352459	jalview.analysis.scoremodels.FeatureDistanceModelTest.testFeatureScoreModel_hiddenFirstColumnjalview.analysis.scoremodels.FeatureDistanceModelTest.testFeatureScoreModel_hiddenFirstColumn	1PASS
0.06352459	jalview.gui.AlignFrameTest.testNewView_dsRefPreservedjalview.gui.AlignFrameTest.testNewView_dsRefPreserved	1PASS
0.06352459	jalview.gui.AlignViewportTest.testSetGlobalColourSchemejalview.gui.AlignViewportTest.testSetGlobalColourScheme	1PASS
0.06352459	jalview.renderer.seqfeatures.FeatureRendererTest.testFindAllFeaturesjalview.renderer.seqfeatures.FeatureRendererTest.testFindAllFeatures	1PASS
0.06352459	jalview.gui.FeatureSettingsTest.testSaveLoadjalview.gui.FeatureSettingsTest.testSaveLoad	1PASS
0.06352459	jalview.project.Jalview2xmlTests.testTCoffeeScoresjalview.project.Jalview2xmlTests.testTCoffeeScores	1PASS
0.06352459	jalview.analysis.scoremodels.FeatureDistanceModelTest.testFeatureScoreModeljalview.analysis.scoremodels.FeatureDistanceModelTest.testFeatureScoreModel	1PASS
0.06352459	jalview.project.Jalview2xmlTests.testStoreAndRecoverColourThresholdsjalview.project.Jalview2xmlTests.testStoreAndRecoverColourThresholds	1PASS
0.06352459	jalview.renderer.seqfeatures.FeatureRendererTest.testIsVisiblejalview.renderer.seqfeatures.FeatureRendererTest.testIsVisible	1PASS
0.06352459	jalview.schemes.ColourSchemesTest.testGetColourSchemejalview.schemes.ColourSchemesTest.testGetColourScheme	1PASS
0.06352459	jalview.io.gff.ExonerateHelperTest.testAddExonerateGffToAlignmentjalview.io.gff.ExonerateHelperTest.testAddExonerateGffToAlignment	1PASS
0.06352459	jalview.io.BackupFilesTest.backupsEnabledReverseRollMaxTestjalview.io.BackupFilesTest.backupsEnabledReverseRollMaxTest	1PASS
0.06352459	jalview.ext.jmol.JmolParserTest.testAlignmentLoaderjalview.ext.jmol.JmolParserTest.testAlignmentLoader	1PASS
0.06352459	jalview.gui.AlignViewportTest.testSetSelectionGroupjalview.gui.AlignViewportTest.testSetSelectionGroup	1PASS
0.06352459	jalview.io.FeaturesFileTest.testPrintGffFormatjalview.io.FeaturesFileTest.testPrintGffFormat	1PASS
0.06352459	jalview.renderer.ScaleRendererTest.testCalculateMarksjalview.renderer.ScaleRendererTest.testCalculateMarks	1PASS
0.06352459	jalview.gui.SeqPanelTest.testFindMousePosition_wrapped_scaleAbovejalview.gui.SeqPanelTest.testFindMousePosition_wrapped_scaleAbove	1PASS
0.06352459	jalview.gui.PaintRefresherTest.testGetAssociatedPanelsjalview.gui.PaintRefresherTest.testGetAssociatedPanels	1PASS
0.06352459	jalview.io.FeaturesFileTest.testParse_pureGff3jalview.io.FeaturesFileTest.testParse_pureGff3	1PASS
0.06352459	jalview.io.BackupFilesTest.backupsEnabledRollMaxTestjalview.io.BackupFilesTest.backupsEnabledRollMaxTest	1PASS
0.06352459	jalview.io.JSONFileTest.testGrpParsed_colourNonejalview.io.JSONFileTest.testGrpParsed_colourNone	1PASS
0.06352459	jalview.ext.jmol.JmolViewerTest.testSingleSeqViewJMoljalview.ext.jmol.JmolViewerTest.testSingleSeqViewJMol	1PASS
0.06352459	jalview.io.gff.GffTests.testResolveExonerateGffjalview.io.gff.GffTests.testResolveExonerateGff	1PASS
0.06352459	jalview.controller.AlignViewControllerTest.testFindColumnsWithFeaturejalview.controller.AlignViewControllerTest.testFindColumnsWithFeature	1PASS
0.06352459	jalview.gui.ColourMenuHelperTest.testAddMenuItems_forAlignFramejalview.gui.ColourMenuHelperTest.testAddMenuItems_forAlignFrame	1PASS
0.06352459	jalview.io.FeaturesFileTest.testParse_jalviewFeaturesOnlyjalview.io.FeaturesFileTest.testParse_jalviewFeaturesOnly	1PASS
0.06352459	jalview.io.BackupFilesTest.noBackupsEnabledTestjalview.io.BackupFilesTest.noBackupsEnabledTest	1PASS
0.06352459	jalview.project.Jalview2xmlTests.testColourByAnnotScoresjalview.project.Jalview2xmlTests.testColourByAnnotScores	1PASS
0.06352459	jalview.gui.AlignViewportTest.testUpdateConservation_qualityOnlyjalview.gui.AlignViewportTest.testUpdateConservation_qualityOnly	1PASS
0.06352459	jalview.analysis.scoremodels.FeatureDistanceModelTest.testFindDistances_withParamsjalview.analysis.scoremodels.FeatureDistanceModelTest.testFindDistances_withParams	1PASS
0.06352459	jalview.renderer.seqfeatures.FeatureRendererTest.testFilterFeaturesForDisplayjalview.renderer.seqfeatures.FeatureRendererTest.testFilterFeaturesForDisplay	1PASS
0.06352459	jalview.gui.AlignFrameTest.testHideFeatureColumnsjalview.gui.AlignFrameTest.testHideFeatureColumns	1PASS
0.06352459	jalview.io.FeaturesFileTest.testPrintJalviewFormat_withFiltersjalview.io.FeaturesFileTest.testPrintJalviewFormat_withFilters	1PASS
0.06352459	jalview.project.Jalview2xmlTests.testMergeDatasetsforViewsjalview.project.Jalview2xmlTests.testMergeDatasetsforViews	1PASS
0.06352459	jalview.io.FeaturesFileTest.testPrintJalviewFormatjalview.io.FeaturesFileTest.testPrintJalviewFormat	1PASS
0.06352459	jalview.schemes.ColourSchemesTest.testRegisterColourSchemejalview.schemes.ColourSchemesTest.testRegisterColourScheme	1PASS
0.06352459	jalview.gui.AlignViewportTest.testSetGetHasSearchResultsjalview.gui.AlignViewportTest.testSetGetHasSearchResults	1PASS
0.06352459	jalview.io.FeaturesFileTest.testPrintGffFormat_withFiltersjalview.io.FeaturesFileTest.testPrintGffFormat_withFilters	1PASS
0.06352459	jalview.controller.AlignViewControllerTest.testSelectColumnsWithHighlightjalview.controller.AlignViewControllerTest.testSelectColumnsWithHighlight	1PASS
0.06352459	jalview.ext.jmol.JmolCommandsTest.testGetColourBySequenceCommands_hiddenColumnsjalview.ext.jmol.JmolCommandsTest.testGetColourBySequenceCommands_hiddenColumns	1PASS
0.06352459	jalview.structures.models.AAStructureBindingModelTest.testBuildColoursMapjalview.structures.models.AAStructureBindingModelTest.testBuildColoursMap	1PASS
0.06352459	jalview.io.JSONFileTest.testBioJSONRoundTripWithColourSchemeNonejalview.io.JSONFileTest.testBioJSONRoundTripWithColourSchemeNone	1PASS
0.06352459	jalview.gui.AlignViewportTest.testShowOrDontShowOccupancyjalview.gui.AlignViewportTest.testShowOrDontShowOccupancy	1PASS
0.06352459	jalview.renderer.seqfeatures.FeatureRendererTest.testGetColourjalview.renderer.seqfeatures.FeatureRendererTest.testGetColour	1PASS
0.06147541	jalview.analysis.CrossRefTest.testFindXrefSequences_noDbrefsjalview.analysis.CrossRefTest.testFindXrefSequences_noDbrefs	1PASS
0.043032788	jalview.analysis.CrossRefTest.testSameSequencejalview.analysis.CrossRefTest.testSameSequence	1PASS

Source view

* Jalview - A Sequence Alignment Editor and Viewer ($$Version-Rel$$)

* Copyright (C) $$Year-Rel$$ The Jalview Authors

* This file is part of Jalview.

* Jalview is free software: you can redistribute it and/or

* modify it under the terms of the GNU General Public License

* as published by the Free Software Foundation, either version 3

* of the License, or (at your option) any later version.

* Jalview is distributed in the hope that it will be useful, but

* WITHOUT ANY WARRANTY; without even the implied warranty

* of MERCHANTABILITY or FITNESS FOR A PARTICULAR

* PURPOSE. See the GNU General Public License for more details.

* You should have received a copy of the GNU General Public License

* along with Jalview. If not, see <http://www.gnu.org/licenses/>.

* The Jalview Authors are detailed in the 'AUTHORS' file.

package jalview.analysis;

import jalview.datamodel.AlignedCodonFrame;

import jalview.datamodel.Alignment;

import jalview.datamodel.AlignmentI;

import jalview.datamodel.DBRefEntry;

import jalview.datamodel.DBRefSource;

import jalview.datamodel.Mapping;

import jalview.datamodel.Sequence;

import jalview.datamodel.SequenceFeature;

import jalview.datamodel.SequenceI;

import jalview.util.DBRefUtils;

import jalview.util.MapList;

import jalview.ws.SequenceFetcherFactory;

import jalview.ws.seqfetcher.ASequenceFetcher;

import java.util.ArrayList;

import java.util.Iterator;

import java.util.List;

/**

* Functions for cross-referencing sequence databases.

* @author JimP

public class CrossRef

{

* the dataset of the alignment for which we are searching for

* cross-references; in some cases we may resolve xrefs by

* searching in the dataset

private AlignmentI dataset;

* the sequences for which we are seeking cross-references

private SequenceI[] fromSeqs;

/**

* matcher built from dataset

SequenceIdMatcher matcher;

/**

* sequences found by cross-ref searches to fromSeqs

List<SequenceI> rseqs;

/**

* Constructor

* @param seqs

* the sequences for which we are seeking cross-references

* @param ds

* the containing alignment dataset (may be searched to resolve

* cross-references)

432

public CrossRef(SequenceI[] seqs, AlignmentI ds)

{

432

fromSeqs = seqs;

432

dataset = ds.getDataset() == null ? ds : ds.getDataset();

}

/**

* Returns a list of distinct database sources for which sequences have either

* <ul>

* <li>a (dna-to-protein or protein-to-dna) cross-reference</li>

* <li>an indirect cross-reference - a (dna-to-protein or protein-to-dna)

* reference from another sequence in the dataset which has a cross-reference

* to a direct DBRefEntry on the given sequence</li>

* </ul>

* @param dna

* - when true, cross-references *from* dna returned. When false,

* cross-references *from* protein are returned

* @return

100

425

public List<String> findXrefSourcesForSequences(boolean dna)

101

{

102

425

List<String> sources = new ArrayList<>();

103

425

for (SequenceI seq : fromSeqs)

104

{

105

4686

if (seq != null)

106

{

107

4686

findXrefSourcesForSequence(seq, dna, sources);

108

}

109

}

110

425

sources.remove(DBRefSource.EMBL); // hack to prevent EMBL xrefs resulting in

111

// redundant datasets

112

425

if (dna)

113

{

114

sources.remove(DBRefSource.ENSEMBL); // hack to prevent Ensembl and

115

// EnsemblGenomes xref option shown

116

// from cdna panel

117

sources.remove(DBRefSource.ENSEMBLGENOMES);

118

}

119

// redundant datasets

120

425

return sources;

}

/**

* Returns a list of distinct database sources for which a sequence has either

125

* <ul>

126

* <li>a (dna-to-protein or protein-to-dna) cross-reference</li>

127

* <li>an indirect cross-reference - a (dna-to-protein or protein-to-dna)

128

* reference from another sequence in the dataset which has a cross-reference

129

* to a direct DBRefEntry on the given sequence</li>

* </ul>

* @param seq

* the sequence whose dbrefs we are searching against

134

* @param fromDna

135

* when true, context is DNA - so sources identifying protein

136

* products will be returned.

137

* @param sources

138

* a list of sources to add matches to

139

140

4686

void findXrefSourcesForSequence(SequenceI seq, boolean fromDna,

141

List<String> sources)

142

{

143

144

* first find seq's xrefs (dna-to-peptide or peptide-to-dna)

145

146

4686

List<DBRefEntry> rfs = DBRefUtils.selectDbRefs(!fromDna, seq.getDBRefs());

147

4686

addXrefsToSources(rfs, sources);

148

4686

if (dataset != null)

149

{

150

151

* find sequence's direct (dna-to-dna, peptide-to-peptide) xrefs

152

153

4686

List<DBRefEntry> lrfs = DBRefUtils.selectDbRefs(fromDna, seq.getDBRefs());

154

4686

List<SequenceI> foundSeqs = new ArrayList<>();

155

156

157

* find sequences in the alignment which xref one of these DBRefs

158

* i.e. is xref-ed to a common sequence identifier

159

160

4686

searchDatasetXrefs(fromDna, seq, lrfs, foundSeqs, null);

161

162

163

* add those sequences' (dna-to-peptide or peptide-to-dna) dbref sources

164

165

4686

for (SequenceI rs : foundSeqs)

166

{

167

394

List<DBRefEntry> xrs = DBRefUtils.selectDbRefs(!fromDna,

168

rs.getDBRefs());

169

394

addXrefsToSources(xrs, sources);

}

}

}

/**

* Helper method that adds the source identifiers of some cross-references to

176

* a (non-redundant) list of database sources

* @param xrefs

* @param sources

5080

void addXrefsToSources(List<DBRefEntry> xrefs, List<String> sources)

182

{

183

5080

if (xrefs != null)

184

{

185

486

for (DBRefEntry ref : xrefs)

186

{

187

188

* avoid duplication e.g. ENSEMBL and Ensembl

189

190

1812

String source = DBRefUtils.getCanonicalName(ref.getSource());

191

1812

if (!sources.contains(source))

{

sources.add(source);

}

}

}

}

/**

* Attempts to find cross-references from the sequences provided in the

201

* constructor to the given source database. Cross-references may be found

202

* <ul>

203

* <li>in dbrefs on the sequence which hold a mapping to a sequence

204

* <ul>

205

* <li>provided with a fetched sequence (e.g. ENA translation), or</li>

206

* <li>populated previously after getting cross-references</li>

207

* </ul>

208

* <li>as other sequences in the alignment which share a dbref identifier with

209

* the sequence</li>

210

* <li>by fetching from the remote database</li>

211

* </ul>

212

* The cross-referenced sequences, and mappings to them, are added to the

* alignment dataset.

* @param source

* @return cross-referenced sequences (as dataset sequences)

217

218

public Alignment findXrefSequences(String source, boolean fromDna)

219

{

220

221

rseqs = new ArrayList<>();

222

AlignedCodonFrame cf = new AlignedCodonFrame();

223

matcher = new SequenceIdMatcher(dataset.getSequences());

224

225

for (SequenceI seq : fromSeqs)

226

{

227

SequenceI dss = seq;

228

while (dss.getDatasetSequence() != null)

229

{

230

dss = dss.getDatasetSequence();

231

}

232

boolean found = false;

233

List<DBRefEntry> xrfs = DBRefUtils.selectDbRefs(!fromDna,

234

dss.getDBRefs());

235

// ENST & ENSP comes in to both Protein and nucleotide, so we need to

236

// filter them

237

// out later.

238

if ((xrfs == null || xrfs.size() == 0) && dataset != null)

239

{

240

241

* found no suitable dbrefs on sequence - look for sequences in the

242

* alignment which share a dbref with this one

243

244

List<DBRefEntry> lrfs = DBRefUtils.selectDbRefs(fromDna,

seq.getDBRefs());

* find sequences (except this one!), of complementary type,

249

* which have a dbref to an accession id for this sequence,

250

* and add them to the results

251

252

found = searchDatasetXrefs(fromDna, dss, lrfs, rseqs, cf);

253

}

254

if (xrfs == null && !found)

255

{

256

257

* no dbref to source on this sequence or matched

258

* complementary sequence in the dataset

continue;

}

List<DBRefEntry> sourceRefs = DBRefUtils.searchRefsForSource(xrfs,

263

source);

264

Iterator<DBRefEntry> refIterator = sourceRefs.iterator();

265

// At this point, if we are retrieving Ensembl, we still don't filter out

266

// ENST when looking for protein crossrefs.

267

while (refIterator.hasNext())

268

{

269

DBRefEntry xref = refIterator.next();

270

found = false;

271

// we're only interested in coding cross-references, not

272

// locus->transcript

273

if (xref.hasMap() && xref.getMap().getMap().isTripletMap())

274

{

275

SequenceI mappedTo = xref.getMap().getTo();

276

if (mappedTo != null)

277

{

278

279

* dbref contains the sequence it maps to; add it to the

280

* results unless we have done so already (could happen if

281

* fetching xrefs for sequences which have xrefs in common)

282

* for example: UNIPROT {P0CE19, P0CE20} -> EMBL {J03321, X06707}

found = true;

* problem: matcher.findIdMatch() is lenient - returns a sequence

287

* with a dbref to the search arg e.g. ENST for ENSP - wrong

288

* but findInDataset() matches ENSP when looking for Uniprot...

289

290

SequenceI matchInDataset = findInDataset(xref);

291

if (matchInDataset != null && xref.getMap().getTo() != null

292

&& matchInDataset != xref.getMap().getTo())

293

{

294

System.err.println(

295

"Implementation problem (reopen JAL-2154): CrossRef.findInDataset seems to have recovered a different sequence than the one explicitly mapped for xref."

296

+ "Found:" + matchInDataset + "\nExpected:"

297

+ xref.getMap().getTo() + "\nFor xref:"

298

+ xref);

299

}

300

/*matcher.findIdMatch(mappedTo);*/

301

if (matchInDataset != null)

302

{

303

if (!rseqs.contains(matchInDataset))

304

{

305

rseqs.add(matchInDataset);

306

}

307

// even if rseqs contained matchInDataset - check mappings between

308

// these seqs are added

309

// need to try harder to only add unique mappings

310

if (xref.getMap().getMap().isTripletMap()

311

&& dataset.getMapping(seq, matchInDataset) == null

312

&& cf.getMappingBetween(seq, matchInDataset) == null)

313

{

314

// materialise a mapping for highlighting between these

// sequences

if (fromDna)

{

cf.addMap(dss, matchInDataset, xref.getMap().getMap(),

319

xref.getMap().getMappedFromId());

}

else

{

cf.addMap(matchInDataset, dss,

324

xref.getMap().getMap().getInverse(),

325

xref.getMap().getMappedFromId());

}

}

refIterator.remove();

330

continue;

331

}

332

// TODO: need to determine if this should be a deriveSequence

333

SequenceI rsq = new Sequence(mappedTo);

334

rseqs.add(rsq);

335

if (xref.getMap().getMap().isTripletMap())

336

{

337

// get sense of map correct for adding to product alignment.

338

if (fromDna)

339

{

340

// map is from dna seq to a protein product

341

cf.addMap(dss, rsq, xref.getMap().getMap(),

342

xref.getMap().getMappedFromId());

}

else

{

// map should be from protein seq to its coding dna

347

cf.addMap(rsq, dss, xref.getMap().getMap().getInverse(),

348

xref.getMap().getMappedFromId());

}

}

}

}

if (!found)

{

SequenceI matchedSeq = matcher.findIdMatch(

357

xref.getSource() + "|" + xref.getAccessionId());

358

// if there was a match, check it's at least the right type of

359

// molecule!

360

if (matchedSeq != null && matchedSeq.isProtein() == fromDna)

361

{

362

if (constructMapping(seq, matchedSeq, xref, cf, fromDna))

{

found = true;

}

}

}

if (!found)

{

// do a bit more work - search for sequences with references matching

372

// xrefs on this sequence.

373

found = searchDataset(fromDna, dss, xref, rseqs, cf, false, DBRefUtils.SEARCH_MODE_FULL);

}

if (found)

{

refIterator.remove();

}

}

* fetch from source database any dbrefs we haven't resolved up to here

383

384

if (!sourceRefs.isEmpty())

385

{

386

retrieveCrossRef(sourceRefs, seq, xrfs, fromDna, cf);

}

}

Alignment ral = null;

391

if (rseqs.size() > 0)

392

{

393

ral = new Alignment(rseqs.toArray(new SequenceI[rseqs.size()]));

394

if (!cf.isEmpty())

395

{

396

dataset.addCodonFrame(cf);

}

}

return ral;

}

private void retrieveCrossRef(List<DBRefEntry> sourceRefs, SequenceI seq,

403

List<DBRefEntry> xrfs, boolean fromDna, AlignedCodonFrame cf)

404

{

405

ASequenceFetcher sftch = SequenceFetcherFactory.getSequenceFetcher();

406

SequenceI[] retrieved = null;

407

SequenceI dss = seq.getDatasetSequence() == null ? seq

408

: seq.getDatasetSequence();

409

// first filter in case we are retrieving crossrefs that have already been

410

// retrieved. this happens for cases where a database record doesn't yield

411

// protein products for CDS

412

removeAlreadyRetrievedSeqs(sourceRefs, fromDna);

413

if (sourceRefs.size() == 0)

414

{

415

// no more work to do! We already had all requested sequence records in

// the dataset.

return;

}

try

{

retrieved = sftch.getSequences(sourceRefs, !fromDna);

422

} catch (Exception e)

423

{

424

System.err.println(

425

"Problem whilst retrieving cross references for Sequence : "

+ seq.getName());

e.printStackTrace();

}

if (retrieved != null)

431

{

432

boolean addedXref = false;

433

List<SequenceI> newDsSeqs = new ArrayList<>(),

434

doNotAdd = new ArrayList<>();

435

436

for (SequenceI retrievedSequence : retrieved)

437

{

438

// dataset gets contaminated ccwith non-ds sequences. why ??!

439

// try: Ensembl -> Nuc->Ensembl, Nuc->Uniprot-->Protein->EMBL->

440

SequenceI retrievedDss = retrievedSequence

441

.getDatasetSequence() == null ? retrievedSequence

442

: retrievedSequence.getDatasetSequence();

443

addedXref |= importCrossRefSeq(cf, newDsSeqs, doNotAdd, dss,

retrievedDss);

}

if (!addedXref)

{

// try again, after looking for matching IDs

449

// shouldn't need to do this unless the dbref mechanism has broken.

450

updateDbrefMappings(seq, xrfs, retrieved, cf, fromDna);

451

for (SequenceI retrievedSequence : retrieved)

452

{

453

// dataset gets contaminated ccwith non-ds sequences. why ??!

454

// try: Ensembl -> Nuc->Ensembl, Nuc->Uniprot-->Protein->EMBL->

455

SequenceI retrievedDss = retrievedSequence

456

.getDatasetSequence() == null ? retrievedSequence

457

: retrievedSequence.getDatasetSequence();

458

addedXref |= importCrossRefSeq(cf, newDsSeqs, doNotAdd, dss,

retrievedDss);

}

}

for (SequenceI newToSeq : newDsSeqs)

463

{

464

if (!doNotAdd.contains(newToSeq)

465

&& dataset.findIndex(newToSeq) == -1)

466

{

467

dataset.addSequence(newToSeq);

468

matcher.add(newToSeq);

}

}

}

}

/**

* Search dataset for sequences with a primary reference contained in

* sourceRefs.

* @param sourceRefs

* - list of references to filter.

480

* @param fromDna

481

* - type of sequence to search for matching primary reference.

482

483

private void removeAlreadyRetrievedSeqs(List<DBRefEntry> sourceRefs,

484

boolean fromDna)

485

{

486

List<DBRefEntry> dbrSourceSet = new ArrayList<>(sourceRefs);

487

List<SequenceI> dsSeqs = dataset.getSequences();

488

for (int ids = 0, nds = dsSeqs.size(); ids < nds; ids++)

489

{

490

SequenceI sq = dsSeqs.get(ids);

491

boolean dupeFound = false;

492

// !fromDna means we are looking only for nucleotide sequences, not

493

// protein

494

if (sq.isProtein() == fromDna)

495

{

496

List<DBRefEntry> sqdbrefs = sq.getPrimaryDBRefs();

497

for (int idb = 0, ndb = sqdbrefs.size(); idb < ndb; idb++)

498

{

499

DBRefEntry dbr = sqdbrefs.get(idb);

500

List<DBRefEntry> searchrefs = DBRefUtils.searchRefs(dbrSourceSet, dbr, DBRefUtils.SEARCH_MODE_FULL);

501

for (int isr = 0, nsr = searchrefs.size(); isr < nsr; isr++)

502

{

503

sourceRefs.remove(searchrefs.get(isr));

dupeFound = true;

}

}

}

if (dupeFound)

{

// rebuild the search array from the filtered sourceRefs list

511

dbrSourceSet.clear();

512

dbrSourceSet.addAll(sourceRefs);

}

}

}

/**

* process sequence retrieved via a dbref on source sequence to resolve and

* transfer data

* @param cf

* @param sourceSequence

523

* @param retrievedSequence

524

* @return true if retrieveSequence was imported

525

526

private boolean importCrossRefSeq(AlignedCodonFrame cf,

527

List<SequenceI> newDsSeqs, List<SequenceI> doNotAdd,

528

SequenceI sourceSequence, SequenceI retrievedSequence)

529

{

530

/**

531

* set when retrievedSequence has been verified as a crossreference for

532

* sourceSequence

533

534

boolean imported = false;

535

List<DBRefEntry> dbr = retrievedSequence.getDBRefs();

536

if (dbr != null)

537

{

538

for (int ib = 0, nb = dbr.size(); ib < nb; ib++)

539

{

540

541

DBRefEntry dbref = dbr.get(ib);

542

SequenceI matched = findInDataset(dbref);

543

if (matched == sourceSequence)

544

{

545

// verified retrieved and source sequence cross-reference each other

546

imported = true;

547

}

548

// find any entry where we should put in the sequence being

549

// cross-referenced into the map

550

Mapping map = dbref.getMap();

551

if (map != null)

552

{

553

SequenceI ms = map.getTo();

554

if (ms != null && map.getMap() != null)

555

{

556

if (ms == sourceSequence)

557

{

558

// already called to import once, and most likely this sequence

559

// already imported !

continue;

}

if (matched == null)

{

* sequence is new to dataset, so save a reference so it can be added.

newDsSeqs.add(ms);

continue;

}

* there was a matching sequence in dataset, so now, check to see if we can update the map.getTo() sequence to the existing one.

try

{

// compare ms with dss and replace with dss in mapping

578

// if map is congruent

579

// TODO findInDataset requires exact sequence match but

580

// 'congruent' test is only for the mapped part

581

// maybe not a problem in practice since only ENA provide a

582

// mapping and it is to the full protein translation of CDS

583

// matcher.findIdMatch(map.getTo());

584

// TODO addendum: if matched is shorter than getTo, this will fail

585

// - when it should really succeed.

586

int sf = map.getMap().getToLowest();

587

int st = map.getMap().getToHighest();

588

SequenceI mappedrg = ms.getSubSequence(sf, st);

589

if (mappedrg.getLength() > 0 && ms.getSequenceAsString()

590

.equals(matched.getSequenceAsString()))

591

{

592

593

* sequences were a match,

594

595

String msg = "Mapping updated from " + ms.getName()

596

+ " to retrieved crossreference "

597

+ matched.getName();

598

System.out.println(msg);

599

600

List<DBRefEntry> toRefs = map.getTo().getDBRefs();

if (toRefs != null)

{

* transfer database refs

605

606

for (DBRefEntry ref : toRefs)

607

{

608

if (dbref.getSrcAccString()

609

.equals(ref.getSrcAccString()))

610

{

611

continue; // avoid overwriting the ref on source sequence

612

}

613

matched.addDBRef(ref); // add or update mapping

614

}

615

}

616

doNotAdd.add(map.getTo());

map.setTo(matched);

* give the reverse reference the inverse mapping

621

* (if it doesn't have one already)

622

623

setReverseMapping(matched, dbref, cf);

624

625

626

* copy sequence features as well, avoiding

627

* duplication (e.g. same variation from two

628

* transcripts)

629

630

List<SequenceFeature> sfs = ms.getFeatures()

631

.getAllFeatures();

632

for (SequenceFeature feat : sfs)

633

{

634

635

* make a flyweight feature object which ignores Parent

636

* attribute in equality test; this avoids creating many

637

* otherwise duplicate exon features on genomic sequence

638

639

SequenceFeature newFeature = new SequenceFeature(feat)

640

{

641

@Override

642

public boolean equals(Object o)

643

{

644

return super.equals(o, true);

645

}

646

};

647

matched.addSequenceFeature(newFeature);

648

}

649

}

650

cf.addMap(retrievedSequence, map.getTo(), map.getMap());

651

} catch (Exception e)

652

{

653

System.err.println(

654

"Exception when consolidating Mapped sequence set...");

655

e.printStackTrace(System.err);

}

}

}

}

}

if (imported)

{

retrievedSequence.updatePDBIds();

664

rseqs.add(retrievedSequence);

665

if (dataset.findIndex(retrievedSequence) == -1)

666

{

667

dataset.addSequence(retrievedSequence);

668

matcher.add(retrievedSequence);

}

}

return imported;

}

/**

* Sets the inverse sequence mapping in the corresponding dbref of the mapped

676

* to sequence (if any). This is used after fetching a cross-referenced

677

* sequence, if the fetched sequence has a mapping to the original sequence,

678

* to set the mapping in the original sequence's dbref.

679

680

* @param mapFrom

681

* the sequence mapped from

* @param dbref

* @param mappings

void setReverseMapping(SequenceI mapFrom, DBRefEntry dbref,

686

AlignedCodonFrame mappings)

687

{

688

SequenceI mapTo = dbref.getMap().getTo();

if (mapTo == null)

{

return;

}

List<DBRefEntry> dbrefs = mapTo.getDBRefs();

if (dbrefs == null)

{

return;

}

for (DBRefEntry toRef : dbrefs)

699

{

700

if (toRef.hasMap() && mapFrom == toRef.getMap().getTo())

701

{

702

703

* found the reverse dbref; update its mapping if null

704

705

if (toRef.getMap().getMap() == null)

706

{

707

MapList inverse = dbref.getMap().getMap().getInverse();

708

toRef.getMap().setMap(inverse);

709

mappings.addMap(mapTo, mapFrom, inverse);

}

}

}

}

/**

* Returns null or the first sequence in the dataset which is identical to

717

* xref.mapTo, and has a) a primary dbref matching xref, or if none found, the

718

* first one with an ID source|xrefacc

719

720

* @param xref

721

* with map and mapped-to sequence

722

* @return

723

724

SequenceI findInDataset(DBRefEntry xref)

725

{

726

if (xref == null || !xref.hasMap() || xref.getMap().getTo() == null)

{

return null;

}

SequenceI mapsTo = xref.getMap().getTo();

731

String name = xref.getAccessionId();

732

String name2 = xref.getSource() + "|" + name;

733

SequenceI dss = mapsTo.getDatasetSequence() == null ? mapsTo

734

: mapsTo.getDatasetSequence();

735

// first check ds if ds is directly referenced

736

if (dataset.findIndex(dss) > -1)

{

return dss;

}

DBRefEntry template = new DBRefEntry(xref.getSource(), null,

741

xref.getAccessionId());

742

/**

743

* remember the first ID match - in case we don't find a match to template

744

745

SequenceI firstIdMatch = null;

746

for (SequenceI seq : dataset.getSequences())

747

{

748

// first check primary refs.

749

List<DBRefEntry> match = DBRefUtils.searchRefs(

750

seq.getPrimaryDBRefs(), template, DBRefUtils.SEARCH_MODE_FULL);

751

if (match != null && match.size() == 1 && sameSequence(seq, dss))

{

return seq;

}

* clumsy alternative to using SequenceIdMatcher which currently

757

* returns sequences with a dbref to the matched accession id

758

* which we don't want

759

760

if (firstIdMatch == null && (name.equals(seq.getName())

761

|| seq.getName().startsWith(name2)))

762

{

763

if (sameSequence(seq, dss))

{

firstIdMatch = seq;

}

}

}

return firstIdMatch;

}

/**

* Answers true if seq1 and seq2 contain exactly the same characters (ignoring

774

* case), else false. This method compares the lengths, then each character in

775

* turn, in order to 'fail fast'. For case-sensitive comparison, it would be

776

* possible to use Arrays.equals(seq1.getSequence(), seq2.getSequence()).

* @param seq1

* @param seq2

* @return

// TODO move to Sequence / SequenceI

783

static boolean sameSequence(SequenceI seq1, SequenceI seq2)

{

if (seq1 == seq2)

{

return true;

}

if (seq1 == null || seq2 == null)

{

return false;

}

if (seq1.getLength() != seq2.getLength())

{

return false;

}

int length = seq1.getLength();

799

for (int i = 0; i < length; i++)

800

{

801

int diff = seq1.getCharAt(i) - seq2.getCharAt(i);

802

803

* same char or differ in case only ('a'-'A' == 32)

804

805

if (diff != 0 && diff != 32 && diff != -32)

{

return false;

}

}

return true;

}

/**

* Updates any empty mappings in the cross-references with one to a compatible

815

* retrieved sequence if found, and adds any new mappings to the

* AlignedCodonFrame

* @param mapFrom

* @param xrefs

* @param retrieved

* @param acf

void updateDbrefMappings(SequenceI mapFrom, List<DBRefEntry> xrefs,

824

SequenceI[] retrieved, AlignedCodonFrame acf, boolean fromDna)

825

{

826

SequenceIdMatcher idMatcher = new SequenceIdMatcher(retrieved);

827

for (DBRefEntry xref : xrefs)

{

if (!xref.hasMap())

{

String targetSeqName = xref.getSource() + "|"

832

+ xref.getAccessionId();

833

SequenceI[] matches = idMatcher.findAllIdMatches(targetSeqName);

if (matches == null)

{

return;

}

for (SequenceI seq : matches)

839

{

840

constructMapping(mapFrom, seq, xref, acf, fromDna);

}

}

}

}

/**

* Tries to make a mapping between sequences. If successful, adds the mapping

848

* to the dbref and the mappings collection and answers true, otherwise

849

* answers false. The following methods of making are mapping are tried in

850

* turn:

851

* <ul>

852

* <li>if 'mapTo' holds a mapping to 'mapFrom', take the inverse; this is, for

853

* example, the case after fetching EMBL cross-references for a Uniprot

854

* sequence</li>

855

* <li>else check if the dna translates exactly to the protein (give or take

856

* start and stop codons></li>

857

* <li>else try to map based on CDS features on the dna sequence</li>

* </ul>

* @param mapFrom

* @param mapTo

* @param xref

* @param mappings

* @return

boolean constructMapping(SequenceI mapFrom, SequenceI mapTo,

867

DBRefEntry xref, AlignedCodonFrame mappings, boolean fromDna)

868

{

869

MapList mapping = null;

870

SequenceI dsmapFrom = mapFrom.getDatasetSequence() == null ? mapFrom

871

: mapFrom.getDatasetSequence();

872

SequenceI dsmapTo = mapTo.getDatasetSequence() == null ? mapTo

873

: mapTo.getDatasetSequence();

874

875

* look for a reverse mapping, if found make its inverse.

876

* Note - we do this on dataset sequences only.

877

878

if (dsmapTo.getDBRefs() != null)

879

{

880

for (DBRefEntry dbref : dsmapTo.getDBRefs())

881

{

882

String name = dbref.getSource() + "|" + dbref.getAccessionId();

883

if (dbref.hasMap() && dsmapFrom.getName().startsWith(name))

884

{

885

886

* looks like we've found a map from 'mapTo' to 'mapFrom'

887

* - invert it to make the mapping the other way

888

889

MapList reverse = dbref.getMap().getMap().getInverse();

890

xref.setMap(new Mapping(dsmapTo, reverse));

891

mappings.addMap(mapFrom, dsmapTo, reverse);

return true;

}

}

}

if (fromDna)

{

mapping = AlignmentUtils.mapCdnaToProtein(mapTo, mapFrom);

}

else

{

mapping = AlignmentUtils.mapCdnaToProtein(mapFrom, mapTo);

904

if (mapping != null)

905

{

906

mapping = mapping.getInverse();

}

}

if (mapping == null)

{

return false;

}

xref.setMap(new Mapping(mapTo, mapping));

914

915

916

* and add a reverse DbRef with the inverse mapping

917

918

if (mapFrom.getDatasetSequence() != null && false)

919

// && mapFrom.getDatasetSequence().getSourceDBRef() != null)

920

{

921

// possible need to search primary references... except, why doesn't xref

922

// == getSourceDBRef ??

923

// DBRefEntry dbref = new DBRefEntry(mapFrom.getDatasetSequence()

924

// .getSourceDBRef());

925

// dbref.setMap(new Mapping(mapFrom.getDatasetSequence(), mapping

926

// .getInverse()));

927

// mapTo.addDBRef(dbref);

}

if (fromDna)

{

// AlignmentUtils.computeProteinFeatures(mapFrom, mapTo, mapping);

933

mappings.addMap(mapFrom, mapTo, mapping);

}

else

{

mappings.addMap(mapTo, mapFrom, mapping.getInverse());

}

return true;

}

/**

* find references to lrfs in the cross-reference set of each sequence in

945

* dataset (that is not equal to sequenceI) Identifies matching DBRefEntry

946

* based on source and accession string only - Map and Version are nulled.

947

948

* @param fromDna

949

* - true if context was searching from Dna sequences, false if

950

* context was searching from Protein sequences

* @param sequenceI

* @param lrfs

* @param foundSeqs

* @return true if matches were found.

955

956

4689

private boolean searchDatasetXrefs(boolean fromDna, SequenceI sequenceI,

957

List<DBRefEntry> lrfs, List<SequenceI> foundSeqs,

958

AlignedCodonFrame cf)

959

{

960

4689

boolean found = false;

961

4689

if (lrfs == null)

962

{

963

2968

return false;

964

}

965

3797

for (int i = 0, n = lrfs.size(); i < n; i++)

966

{

967

// DBRefEntry xref = new DBRefEntry(lrfs.get(i));

968

// // add in wildcards

969

// xref.setVersion(null);

970

// xref.setMap(null);

971

2076

found |= searchDataset(fromDna, sequenceI, lrfs.get(i), foundSeqs, cf,

972

false, DBRefUtils.SEARCH_MODE_NO_MAP_NO_VERSION);

973

}

974

1721

return found;

}

/**

* Searches dataset for DBRefEntrys matching the given one (xrf) and adds the

979

* associated sequence to rseqs

980

981

* @param fromDna

982

* true if context was searching for refs *from* dna sequence, false

983

* if context was searching for refs *from* protein sequence

984

* @param fromSeq

985

* a sequence to ignore (start point of search)

986

* @param xrf

987

* a cross-reference to try to match

988

* @param foundSeqs

989

* result list to add to

990

* @param mappings

991

* a set of sequence mappings to add to

992

* @param direct

993

* - indicates the type of relationship between returned sequences,

994

* xrf, and sequenceI that is required.

995

* <ul>

996

* <li>direct implies xrf is a primary reference for sequenceI AND

997

* the sequences to be located (eg a uniprot ID for a protein

998

* sequence, and a uniprot ref on a transcript sequence).</li>

999

* <li>indirect means xrf is a cross reference with respect to

1000

* sequenceI or all the returned sequences (eg a genomic reference

1001

* associated with a locus and one or more transcripts)</li>

1002

* </ul>

1003

* @param mode SEARCH_MODE_FULL for all; SEARCH_MODE_NO_MAP_NO_VERSION optional

1004

* @return true if relationship found and sequence added.

1005

1006

2101

boolean searchDataset(boolean fromDna, SequenceI fromSeq, DBRefEntry xrf,

1007

List<SequenceI> foundSeqs, AlignedCodonFrame mappings,

1008

boolean direct, int mode)

1009

{

1010

2101

boolean found = false;

1011

2101

if (dataset == null)

{

return false;

}

2101

if (dataset.getSequences() == null)

1016

{

1017

System.err.println("Empty dataset sequence set - NO VECTOR");

1018

return false;

1019

}

1020

2101

List<SequenceI> ds = dataset.getSequences();

1021

2101

synchronized (ds)

1022

{

1023

2101

for (SequenceI nxt : ds)

1024

{

1025

46848

if (nxt != null)

1026

{

1027

46848

if (nxt.getDatasetSequence() != null)

1028

{

1029

System.err.println(

1030

"Implementation warning: CrossRef initialised with a dataset alignment with non-dataset sequences in it! ("

1031

+ nxt.getDisplayId(true) + " has ds reference "

1032

+ nxt.getDatasetSequence().getDisplayId(true)

1033

+ ")");

1034

}

1035

46848

if (nxt == fromSeq || nxt == fromSeq.getDatasetSequence())

1036

{

1037

2098

continue;

1038

}

1039

1040

* only look at same molecule type if 'direct', or

1041

* complementary type if !direct

1042

1043

{

1044

44750

boolean isDna = !nxt.isProtein();

1045

44750

if (direct ? (isDna != fromDna) : (isDna == fromDna))

1046

{

1047

// skip this sequence because it is wrong molecule type

1048

38916

continue;

}

}

// look for direct or indirect references in common

1053

5834

List<DBRefEntry> poss = nxt.getDBRefs();

1054

5834

List<DBRefEntry> cands = null;

1055

1056

// todo: indirect specifies we select either direct references to nxt

1057

// that match xrf which is indirect to sequenceI, or indirect

1058

// references to nxt that match xrf which is direct to sequenceI

1059

5834

cands = DBRefUtils.searchRefs(poss, xrf, mode);

1060

// else

1061

// {

1062

// poss = DBRefUtils.selectDbRefs(nxt.isProtein()!fromDna, poss);

1063

// cands = DBRefUtils.searchRefs(poss, xrf);

1064

// }

1065

5834

if (!cands.isEmpty())

1066

{

1067

1442

if (foundSeqs.contains(nxt))

1068

{

1069

1022

continue;

1070

}

1071

420

found = true;

1072

420

foundSeqs.add(nxt);

1073

420

if (mappings != null && !direct)

1074

{

1075

1076

* if the matched sequence has mapped dbrefs to

1077

* protein product / cdna, add equivalent mappings to

1078

* our source sequence

1079

1080

for (DBRefEntry candidate : cands)

1081

{

1082

Mapping mapping = candidate.getMap();

1083

if (mapping != null)

1084

{

1085

MapList map = mapping.getMap();

1086

if (mapping.getTo() != null

1087

&& map.getFromRatio() != map.getToRatio())

1088

{

1089

1090

* add a mapping, as from dna to peptide sequence

1091

1092

if (map.getFromRatio() == 3)

1093

{

1094

mappings.addMap(nxt, fromSeq, map);

}

else

{

mappings.addMap(nxt, fromSeq, map.getInverse());

}

}

}

}

}

}

}

}

}

2101

return found;

1109

}

1110

}

Coverage Report

File CrossRef.java

Coverage histogram

Code metrics

Classes

Class CrossRef

Contributing tests

Contributing tests

Source view